国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Ubuntu下使用python讀取doc和docx文檔的內容方法

2020-02-23 00:02:52
字體:
來源:轉載
供稿:網友

讀取docx文檔

使用的包是python-docx

1. 安裝python-docx包

sudo pip install python-docx 

2. 使用python-docx包讀取數據

#encoding:utf8 import docx doc = docx.Document('test.docx') docText = '/n'.join([paragraph.text for paragraph in doc.paragraphs]) #print(docText) 

python-docx這個包是不能處理doc文檔的,要讀取doc文檔內容的話需要使用antiword這個工具。

讀取doc文檔

1. 到網站下載antiword。

2. 下載完畢之后解壓,在解壓得到的文件夾中依次運行make和make install命令。

3. 使用antiword讀取doc文檔內容

#encoding:utf8 import subprocess word = 'test.doc' output = subprocess.check_output(['antiword',word]) print(output) 

以上這篇Ubuntu下使用python讀取doc和docx文檔的內容方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 苍梧县| 聂拉木县| 老河口市| 镇平县| 张家川| 淳安县| 清河县| 卓尼县| 新巴尔虎左旗| 怀化市| 望城县| 突泉县| 凉城县| 哈尔滨市| 太谷县| 清丰县| 建德市| 濉溪县| 东辽县| 金湖县| 平和县| 开平市| 卢湾区| 英山县| 蓬莱市| 衢州市| 武胜县| 化德县| 鹰潭市| 祁连县| 贺兰县| 济宁市| 清苑县| 泰兴市| 星子县| 太仓市| 饶河县| 石楼县| 阳曲县| 屯门区| 于田县|