澳门新萄京:python如何编程word文档,Word的实例讲
分类:办公软件

问题:python怎么样编制程序word文书档案?有何样库能够一贯利用?

Python读取word文本操作详解,pythonword

本文钻探的主要难题时Python读取word文本操作,分享了有关概念和贯彻代码,具体如下。

Python读写word文书档案有现有的库能够拍卖。作者这里运用 python-docx。能够用pip install python-docx安装一下。

本文商讨的重要性难点时Python读取word文本操作,分享了连带概念和兑当代码,具体如下。

选拔python工具读写MS Word文件(docx与doc文件),首要接纳了python-docx包。本文给出一些常用的操作,并变成四个样例,协理我们飞速出手。

回答:

一,docx模块

Python能够选用python-docx模块管理word文书档案,管理形式是面向对象的。约等于说python-docx模块会把word文书档案,文书档案中的段落、文本、字体等都充作对象,对目的进行拍卖正是对word文书档案的内容管理。

那边说一句,ppt和excel也会有周边的库哦,并且是直接读取文件之中的xml数据。所以doc格式得另找其余库管理,doc格式不是依据xml的。

一,docx模块

Python能够动用python-docx模块管理word文书档案,管理格局是面向对象的。也正是说python-docx模块会把word文书档案,文书档案中的段落、文本、字体等都充任对象,对目的开展管理正是对word文档的内容管理。

安装

那边介绍三个库—python-docx,特地用来python读写word文档,使用方便、急速,上面作者简介一下那个库的装置和应用,实验碰到win10 python3.6 pycharm5.0,首要内容如下:

二,相关概念

假定需求读取word文书档案中的文字(日常的话,程序也只必要认识word文档中的文字音信),必要先领悟python-docx模块的多少个概念。

1,Document对象,表示一个word文书档案。
2,Paragraph对象,表示word文书档案中的四个段落
3,Paragraph对象的text属性,表示段落中的文本内容。

扶持文书档案:http://python-docx.readthedocs.org/en/latest/

二,相关概念

要是需求读取word文书档案中的文字(平日的话,程序也只须求认知word文书档案中的文字新闻),需求先理解python-docx模块的多少个概念。

1,Document对象,表示多个word文书档案。
2,Paragraph对象,表示word文书档案中的四个段子
3,Paragraph对象的text属性,表示段落中的文本内容。

pyhton处理docx文件要求采用python-docx 包,能够利用pip工具很有利的安装,pip工具在python安装路线下的Scripts文件夹中

1.装置python-docx,那么些从来在cmd窗口输入指令“pip install python-docx”就行,如下:

三,模块的设置和导入

亟需在乎,python-docx模块安装必要在cmd命令行中输入pip install python-docx,如下图表示安装成功(最后那句法文Successfully installed,成功地安装达成,十二分考验波兰语水准。)

澳门新萄京 1

细心在导入模块时,用的是import docx。

也不失为奇了怪了,怎么设置和导入模块时,非常多都休想三个名字,看来是很有供给出三个python版本的模块处理程序python-maven了,本段纯属PS。

1、新建或张开文件。那一个比较轻便用docx的Document类,若钦定路线则是张开文书档案;若未有一点点名路径则是新建文书档案

三,模块的装置和导入

急需专心,python-docx模块安装须求在cmd命令行中输入pip install python-docx,如下图表示安装成功(最后那句乌Crane语Successfully installed,成功地设置到位,十一分考验意大利共和国语水准。)

澳门新萄京 2

瞩目在导入模块时,用的是import docx。

也正是奇了怪了,怎么设置和导入模块时,比比较多都并不是三个名字,看来是很有必不可缺出壹个python版本的模块管理程序python-maven了,本段纯属PS。

pip install python-docx

澳门新萄京 3

四,读取word文本

在了然了地点的新闻之后,就很轻松了,下边先创设三个D:tempword.docx文件,并在里面输入如下内容。

澳门新萄京 4

下一场写一段程序,代码及出口结果如下:

#读取docx中的文本代码示例
import docx
#获取文档对象
file=docx.Document("D:\temp\word.docx")
print("段落数:" str(len(file.paragraphs)))#段落数为13,每个回车隔离一段

#输出每一段的内容
for para in file.paragraphs:
 print(para.text)

#输出段落编号及段落内容
for i in range(len(file.paragraphs)):
 print("第" str(i) "段的内容是:" file.paragraphs[i].text)

运维结果:

================ RESTART: F:/360data/重要数据/桌面/学习笔记/readWord.py ================
段落数:13
啊

我看见一座山

雄伟的大山

真高啊

啊

这座山是!

真的很高!
第0段的内容是:啊
第1段的内容是:
第2段的内容是:我看见一座山
第3段的内容是:
第4段的内容是:雄伟的大山
第5段的内容是:
第6段的内容是:真高啊
第7段的内容是:
第8段的内容是:啊
第9段的内容是:
第10段的内容是:这座山是!
第11段的内容是:
第12段的内容是:真的很高!
>>> 
#coding:utf-8
import docx

#新建文档
doc_new = docx.Document()

#读取文档
doc = docx.Document(ur'C:1.docx')

四,读取word文本

在领悟了上边的音讯之后,就很简短了,上边先创设一个D:澳门新萄京,tempword.docx文件,并在里头输入如下内容。

澳门新萄京 5

下一场写一段程序,代码及出口结果如下:

#读取docx中的文本代码示例
import docx
#获取文档对象
file=docx.Document("D:\temp\word.docx")
print("段落数:" str(len(file.paragraphs)))#段落数为13,每个回车隔离一段

#输出每一段的内容
for para in file.paragraphs:
 print(para.text)

#输出段落编号及段落内容
for i in range(len(file.paragraphs)):
 print("第" str(i) "段的内容是:" file.paragraphs[i].text)

运行结果:

================ RESTART: F:/360data/重要数据/桌面/学习笔记/readWord.py ================
段落数:13
啊

我看见一座山

雄伟的大山

真高啊

啊

这座山是!

真的很高!
第0段的内容是:啊
第1段的内容是:
第2段的内容是:我看见一座山
第3段的内容是:
第4段的内容是:雄伟的大山
第5段的内容是:
第6段的内容是:真高啊
第7段的内容是:
第8段的内容是:啊
第9段的内容是:
第10段的内容是:这座山是!
第11段的内容是:
第12段的内容是:真的很高!
>>> 

理之当然你也足以选用使用easy_install可能手动方式张开安装

2.设置到位后,大家就能够打开简易的测验了,这里笔者分别就读取word文书档案和写入word文书档案做了简短介绍,首要代码及截图如下:

总结

如上正是本文关于Python读取word文本操作详解的全部内容,希望对咱们享有利于。感兴趣的对象能够承袭参照本站别的有关专项论题,如有不足之处,应接留言提议。多谢朋友们对本站的支撑!

本文探究的主要难题时Python读取word文本操作,分享了有关概念和兑今世码,具体如下。 一,docx模块...

2、保存文件。有展开,就有保存。用Document类的save方法,其中参数是保留的文书路线,恐怕要保留的文本流。日常钦点路径就可以。

总结

如上正是本文关于Python读取word文本操作详解的全体内容,希望对大家全数利于。感兴趣的相恋的人能够继续参照本站别的有关专项论题,如有不足之处,应接留言提议。多谢朋友们对本站的支撑!

写入文件内容

  • 读取word文书档案,这里以读取文书档案中的段落文本和表格数据为例,示例文书档案如下:
doc.save(path_or_stream)

你或者感兴趣的小说:

  • Python读取钦命目录下钦定后缀文件并保留为docx
  • python分析html提取数额,并生成word文书档案实例分析
  • Python复制Word内容并应用格式设字体与大小实例代码
  • 运用python批量修改word文件名的点子言传身教
  • 用python结合jieba和wordcloud完结词云效果
  • Python Wordpress制作小说站
  • python 出现SyntaxError: non-keyword arg after keyword arg错误解决办法
  • python批量替换页眉页脚实例代码

这里大家直接提交三个样例,依照自身的急需选用有用的剧情

澳门新萄京 6

3、对象集合。python-docx包蕴了word文书档案的相关对象集合。

#coding=utf-8
from docx import Document
from docx.shared import Pt
from docx.shared import Inches
from docx.oxml.ns import qn
#打开文档
document = Document()
#加入不同等级的标题
document.add_heading(u'MS WORD写入测试',0)
document.add_heading(u'一级标题',1)
document.add_heading(u'二级标题',2)
#添加文本
paragraph = document.add_paragraph(u'我们在做文本测试!')
#设置字号
run = paragraph.add_run(u'设置字号、')
run.font.size = Pt(24)
#设置字体
run = paragraph.add_run('Set Font,')
run.font.name = 'Consolas'
#设置中文字体
run = paragraph.add_run(u'设置中文字体、')
run.font.name=u'宋体'
r = run._element
r.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')
#设置斜体
run = paragraph.add_run(u'斜体、')
run.italic = True
#设置粗体
run = paragraph.add_run(u'粗体').bold = True
#增加引用
document.add_paragraph('Intense quote', style='Intense Quote')
#增加无序列表
document.add_paragraph(
 u'无序列表元素1', style='List Bullet'
)
document.add_paragraph(
 u'无序列表元素2', style='List Bullet'
)
#增加有序列表
document.add_paragraph(
 u'有序列表元素1', style='List Number'
)
document.add_paragraph(
 u'有序列表元素2', style='List Number'
)
#增加图像(此处用到图像image.bmp,请自行添加脚本所在目录中)
document.add_picture('image.bmp', width=Inches(1.25))
#增加表格
table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Name'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
#再增加3行表格元素
for i in xrange(3):
 row_cells = table.add_row().cells
 row_cells[0].text = 'test' str(i)
 row_cells[1].text = str(i)
 row_cells[2].text = 'desc' str(i)
#增加分页
document.add_page_break()
#保存文件
document.save(u'测试.docx')

对应读代替码如下,非常粗略,分别收获具备段落文本和表格数据,然后循环打字与印刷就行,readWord函数输入参数为急需读取的word文书档案:

doc.paragraphs #段落集合
doc.tables #表格集合
doc.sections #节 集合
doc.styles #样式集合
doc.inline_shapes #内置图形 等等...

该段代码生成的文书档案样式如下

澳门新萄京 7

4、插入段落。段落是word最基本的靶子之一。

澳门新萄京 8

程序运营截图如下,已经成功得到到word文书档案的从头到尾的经过:

doc.add_paragraph(u'第一段',style=None) #插入一个段落,文本为“第一段”
#默认是不应用样式,这里也可以不写style参数,或者指定一个段落样式
doc.add_paragraph(u'第二段',style='Heading 2')

#这些样式都是word默认带有的样式,可以直接罗列出来有哪些段落样式
print [s.name for s in doc.styles if s.type==1]

注:有三个难题没找到怎么着消除,即什么为表格设置边框线。假设您知道,还请可以指教。

澳门新萄京 9

5、新添样式。那一个帮助文书档案里面说得不留神,况兼依然立陶宛共和国(Republic of Lithuania)语的。笔者手头上的花色用到那些,就协和雕刻出怎么使用,如下。

读取文件内容

  • 写入word文书档案,这一个也很轻易,构造相应数据结构,然后直接写入word文书档案就行,这里以增多标题、段落、图片、援引、表格,设置字体、有连串表和冬日列表为例,首要测验代码如下:
#coding:utf-8
from docx import Document
from docx.shared import RGBColor #这个是docx的颜色类

#新建文档
doc = Document()

#新增样式(第一个参数是样式名称,第二个参数是样式类型:1代表段落;2代表字符;3代表表格)
style = doc.styles.add_style('style name 1', 2)

#设置具体样式(修改样式字体为蓝色,当然还可以修改其他的,大家自己尝试)
style.font.color.rgb = RGBColor(0x0, 0x0, 0xff)
#coding=utf-8
from docx import Document
#打开文档
document = Document(u'测试.docx')
#读取每段资料
l = [ paragraph.text.encode('gb2312') for paragraph in document.paragraphs];
#输出并观察结果,也可以通过其他手段处理文本即可
for i in l:
 print i
#读取表格材料,并输出结果
tables = [table for table in document.tables];
for table in tables:
 for row in table.rows:
  for cell in row.cells:
   print cell.text.encode('gb2312'),'t',
  print
 print 'n'

澳门新萄京 10

6、应用字符样式。字符自然是在段落里面包车型地铁,能够使用下边方法给段落追Gavin字和装置字符样式。

咱俩依然选拔刚才我们调换的文件,可以看到,输出的结果为

澳门新萄京 11

#插入一个空白段落
p = doc.add_paragraph('')
p.add_run('123', style="Heading 1 Char")
p.add_run('456')
p.add_run('789', style="Heading 2 Char")

#这样一个段落就应用了两个字符样式,中间“456”就没应用样式
print p.text #输出结果是u'123456789' 也还是连续的

澳门新萄京 12

澳门新萄京 13

7、设置字体。当然能够毫无经过设置样式对少数字展开安装,也得以直接设置。

注意:此地大家选取gb2312编码形式读取,首借使承接保险普通话的读写正确。平日意况下,使用的utf-8编码方式。其余,python-docx首要管理docx文件,在加载doc文件时,会冒出难点,借使有恢宏doc文件,提出先将doc文件批量转变为docx文件,例如使用工具doc2doc

程序运维截图如下,已经成功开创并生成word文书档案:

p = doc.add_paragraph('')
r = p.add_run('123')
r.font.bold = True #加粗
r.font.italic = True #倾斜 等等...

以上那篇用python管理MS Word的实例疏解正是笔者分享给大家的全体内容了,希望能给我们多个参阅,也希望我们多多关照脚本之家。

澳门新萄京 14

8、表格操作。表格也是常事选择的一种对象类型。

您恐怕感兴趣的稿子:

  • python实现在windows下操作word的方法
  • Python读取word文本操作详解
  • Python操作Word批量生成作品的章程
  • Python读取Word(.docx)正文音讯的艺术
  • Python达成批量读取word中表格新闻的方法

迄今,大家就大功告成了利用python来编制程序word文书档案。总的来讲,整个过程简单,思路简单,代码也非常少,很好掌握,只要您有早晚的python基础,熟习一下相关示例和代码,多演习一下,非常的慢就会精晓的,python-docx官方网址也提供了特别详细的采纳文书档案,极度符合初我们学习,介绍的很周全,能够参见一下

#新建一个2x3的表格,style可以不写
table=doc.add_table(rows=2,cols=3,style=None)

#可以用table 的rows和columns得到这个表格的行数和列数
print len(table.rows)
print len(table.columns)

#遍历表格
for row in table.rows:
 row.cells[0].text = '1'
 #print row.cells[0].text

#新增行或列
table.add_row()
table.add_column()

回答:

Word常见操作大约正是那么些。大家可以查看帮忙文书档案,也能够用dir和help查看对象的艺术属性和扶持。

python调用word接口首要行使python-docx模块,基本操作官方文书档案有认证。

上述那篇Python读写docx文件的诀窍正是小编分享给大家的全部内容了,希望能给大家叁个参照,也盼望大家多多照看脚本之家。

澳门新萄京 15

您或然感兴趣的稿子:

  • Python使用win32com模块达成数据库表结构自动生成word表格的点子
  • 行使Python通过win32 COM完成Word文书档案的写入与保存方法
  • Python读取钦定目录下钦命后缀文件并保存为docx
  • python docx 汉语字体设置的操作方法
  • Python读取Word(.docx)正文新闻的主意
  • python3如何将docx转换成pdf文件
  • Ubuntu下利用python读取doc和docx文书档案的故事情节措施
  • 澳门新萄京:python如何编程word文档,Word的实例讲解。python-docx修改已存在的Word文档的表格的书体格式方法
  • Python操作word常见方式自己要作为表率服从规则【win32com与docx模块】

法定文书档案的链接在那时无法发,须求的话能够私信作者。

接下去大家一步一步的开端选取Python对wold文书档案举办操作:

  1. 安装python-docx模块
    展开命令提示符,输入“pip install python-docx”导入python-docx模块:
    澳门新萄京 16江湖凸显Successfully installed python-docx-x.x.x表达您安装成功了。

  2. 张开编写翻译器,导入Document和Inches包:
    澳门新萄京 17

  3. 新建docx文件:
    澳门新萄京 18

  4. 铺排文书档案标题:
    澳门新萄京 19

  5. 布署文档内容:
    澳门新萄京 20

  6. 保留文件:
    澳门新萄京 21

澳门新萄京:python如何编程word文档,Word的实例讲解。那时候大家运维一下这一个程序,在左边文件列表中会出现“demo.docx”文件。

澳门新萄京 22

咱俩去文件目录展开它看一下:

澳门新萄京 23

是大家写的文件没有错,那就是Python对word文书档案的基本操作。当然,不止局限于插入标题和段落,还应该有图片表格等,笔者在此地就不一一介绍,若感兴趣请查阅官方文书档案~

澳门新萄京 24

自家是刘坏坏,盘点干货能源。假若自身的答应有哪些疏漏之处,请在人世商议或私信提出。假设对你有助于,请点赞收藏。小编稽首~

回答:

一、安装Python-docx

Python-docx是特意针对于word文书档案的三个模块,只可以读取docx 不可能读取doc文件。说白了,python就也正是windows操作系统,QQ正是跑在windows操作系统上的软件,QQ最大的职能是能够去聊天,说话。 在这里python-docx就一定于此地的qq 它最主要的功用是对docx文件实行操作,管理等.(个人明白,非职业!)

1.1、安装Python-docx

1.1.1、使用虚构境况安装python-docx

pip install python-docx # 安装命令

安装完结后,在此虚构情况中运作Jupyter notebook

jupyter notebook

1.1.2、切换职业目录(使用

本文由澳门新萄京发布于办公软件,转载请注明出处:澳门新萄京:python如何编程word文档,Word的实例讲

上一篇:Word文书档案怎么样实现全自动加密,ComputerWO昂科 下一篇:没有了
猜你喜欢
热门排行
精彩图文