国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python讀取word文本操作詳解

2020-02-22 22:56:36
字體:
來源:轉載
供稿:網友

本文研究的主要問題時Python讀取word文本操作,分享了相關概念和實現代碼,具體如下。

一,docx模塊

Python可以利用python-docx模塊處理word文檔,處理方式是面向對象的。也就是說python-docx模塊會把word文檔,文檔中的段落、文本、字體等都看做對象,對對象進行處理就是對word文檔的內容處理。

二,相關概念

如果需要讀取word文檔中的文字(一般來說,程序也只需要認識word文檔中的文字信息),需要先了解python-docx模塊的幾個概念。

1,Document對象,表示一個word文檔。
2,Paragraph對象,表示word文檔中的一個段落
3,Paragraph對象的text屬性,表示段落中的文本內容。

三,模塊的安裝和導入

需要注意,python-docx模塊安裝需要在cmd命令行中輸入pip install python-docx,如下圖表示安裝成功(最后那句英文Successfully installed,成功地安裝完成,十分考驗英文水平。)

注意在導入模塊時,用的是import docx。

也真是奇了怪了,怎么安裝和導入模塊時,很多都不用一個名字,看來是很有必要出一個python版本的模塊管理程序python-maven了,本段純屬PS。

四,讀取word文本

在了解了上面的信息之后,就很簡單了,下面先創建一個D:/temp/word.docx文件,并在其中輸入如下內容。

然后寫一段程序,代碼及輸出結果如下:

#讀取docx中的文本代碼示例import docx#獲取文檔對象file=docx.Document("D://temp//word.docx")print("段落數:"+str(len(file.paragraphs)))#段落數為13,每個回車隔離一段#輸出每一段的內容for para in file.paragraphs: print(para.text)#輸出段落編號及段落內容for i in range(len(file.paragraphs)): print("第"+str(i)+"段的內容是:"+file.paragraphs[i].text)

運行結果:

================ RESTART: F:/360data/重要數據/桌面/學習筆記/readWord.py ================段落數:13啊我看見一座山雄偉的大山真高啊啊這座山是!真的很高!第0段的內容是:啊第1段的內容是:第2段的內容是:我看見一座山第3段的內容是:第4段的內容是:雄偉的大山第5段的內容是:第6段的內容是:真高啊第7段的內容是:第8段的內容是:啊第9段的內容是:第10段的內容是:這座山是!第11段的內容是:第12段的內容是:真的很高!>>> 

總結

以上就是本文關于Python讀取word文本操作詳解的全部內容,希望對大家有所幫助。感興趣的朋友可以繼續參閱本站其他相關專題,如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 登封市| 遂川县| 黄石市| 通道| 时尚| 新龙县| 大荔县| 台安县| 疏附县| 桐城市| 分宜县| 诸暨市| 日照市| 聊城市| 泰宁县| 建昌县| 两当县| 垫江县| 丽水市| 平凉市| 琼海市| 梅河口市| 商水县| 岳西县| 濉溪县| 乌拉特后旗| 合肥市| 马尔康县| 绥中县| 鄂伦春自治旗| 肇东市| 德安县| 松桃| 遂宁市| 台东市| 普安县| 南丰县| 云和县| 汝南县| 于都县| 胶南市|