国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python3解析庫pyquery的深入講解

2020-02-15 22:03:37
字體:
供稿:網(wǎng)友

前言

pyquery是一個類似jquery的python庫,它實現(xiàn)能夠在xml文檔中進行jQuery查詢,pyquery使用lxml解析器進行快速在xml和html文檔上操作,它提供了和jQuery類似的語法來解析HTML文檔,支持CSS選擇器,使用非常方便

1、pyquery安裝

pip方式安裝:

$pip install pyquery#它依賴cssselect和lxml包pyquery==1.4.0 - cssselect [required: >0.7.9, installed: 1.0.3] #CSS選擇器并將它轉(zhuǎn)換為XPath表達式 - lxml [required: >=2.1, installed: 4.2.2] #處理xml和html解析庫

驗證安裝:

In [1]: import pyqueryIn [2]: pyquery.textOut[2]: <module 'pyquery.text' from '/root/pp1/.venv/lib/python3.6/site-packages/pyquery/text.py'>

2、pyquery對象初始化

pyquery首先需要傳入HTML文本來初始化一個pyquery對象,它的初始化方式有多種,如直接傳入字符串,傳入URL或者傳入文件名

(1)字符串初始化

from pyquery import PyQuery as pqhtml='''<div id="wenzhangziti" class="article 389862"><p>人生是一條沒有盡頭的路,不要留戀逝去的夢,把命運掌握在自己手中,讓我們來掌握自己的命運,別讓別人的干擾與誘惑,別讓功名與利祿,來打翻我們這壇陳釀已久的命運之酒!</p></div>'''doc=pq(html) #初始化并創(chuàng)建pyquery對象print(type(doc))print(doc('p').text())#<class 'pyquery.pyquery.PyQuery'>人生是一條沒有盡頭的路,不要留戀逝去的夢,把命運掌握在自己手中,讓我們來掌握自己的命運,別讓別人的干擾與誘惑,別讓功名與利祿,來打翻我們這壇陳釀已久的命運之酒!

(2)URL初始化

from pyquery import PyQuery as pqdoc=pq(url='https://www.cnblogs.com/zhangxinqi/p/9218395.html')print(type(doc))print(doc('title'))#<class 'pyquery.pyquery.PyQuery'><title>python3解析庫BeautifulSoup4 - Py.qi - 博客園</title>

PyQuery能夠從url加載一個html文檔,之際上是默認情況下調(diào)用python的urllib庫去請求響應(yīng),如果requests已安裝的話它將使用requests來請求響應(yīng),那我們就可以使用request的請求參數(shù)來構(gòu)造請求了,實際請求如下:

from pyquery import PyQuery as pqimport requestsdoc=pq(requests.get(url='https://www.cnblogs.com/zhangxinqi/p/9218395.html').text)print(type(doc))print(doc('title'))#輸出同上一樣<class 'pyquery.pyquery.PyQuery'><title>python3解析庫BeautifulSoup4 - Py.qi - 博客園</title>

(3)通過文件初始化

通過本地的HTML文件來構(gòu)造PyQuery對象

from pyquery import PyQuery as pqdoc=pq(filename='demo.html',parser='html')#doc=pq(open('demo.html','r',encoding='utf-8').read(),parser='html') #注意:在讀取有中文的HTML文件時,請使用此方法,否則會報解碼錯誤print(type(doc))print(doc('p'))            
發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 桂林市| 沾化县| 那曲县| 扶沟县| 炉霍县| 丰城市| 稷山县| 谢通门县| 广安市| 临泉县| 无棣县| 扎鲁特旗| 揭西县| 舞阳县| 玉田县| 修文县| 将乐县| 化隆| 鹤壁市| 仙游县| 泾阳县| 隆尧县| 济宁市| 武功县| 元阳县| 海安县| 南开区| 吴江市| 武安市| 宜宾县| 石城县| 合肥市| 健康| 加查县| 广宁县| 金寨县| 雅安市| 内江市| 瑞丽市| 昆山市| 台州市|