国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 學(xué)院 > 開發(fā)設(shè)計(jì) > 正文

網(wǎng)絡(luò)爬蟲:Requests+lxml

2019-11-14 11:58:09
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

比較常用

# -*-coding:utf8-*-import requestsfrom lxml import etreeurl="http://econpy.pythonanywhere.com/ex/001.html"page=requests.get(url)html=page.textselector = etree.HTML(html)buyer=selector.xpath('//div[@title="buyer-name"]/text()')這個(gè)用的少一些

# -*-coding:utf8-*-import requestsfrom lxml import htmlurl="http://econpy.pythonanywhere.com/ex/001.html"page=requests.get(url)tree=html.fromstring(page.text)buyer=tree.xpath('//div[@title="buyer-name"]/text()')prices=tree.xpath('//span[@class="item-price"]/text()')print (buyer)print (prices)Xpath的語(yǔ)法參考 http://www.survivalescaperooms.com.cn/xpath/xpath_syntax.
aspChrome中使用時(shí)可以下載插件:Xpath helper參考使用requests和lxml編寫python爬蟲小記 http://www.tuicool.com/articles/vABNRbR

XPath在python中的高級(jí)應(yīng)用 參見:http://blog.csdn.net/winterto1990/article/details/47903653

但是遇到中文網(wǎng)頁(yè)時(shí),中文出現(xiàn)亂碼。

req = requests.get("http://news.sina.com.cn/")print (req.text)

為了解決這個(gè)問(wèn)題,請(qǐng)參考這篇文章: http://blog.csdn.net/chaowanghn/article/details/54889835


發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 绥阳县| 克拉玛依市| 江陵县| 承德市| 文水县| 容城县| 祥云县| 临西县| 如东县| 香格里拉县| 拉孜县| 多伦县| 嘉峪关市| 佛教| 阿合奇县| 福海县| 葫芦岛市| 久治县| 司法| 天峨县| 沁水县| 建始县| 岳阳市| 泰来县| 汽车| 呼伦贝尔市| 荔波县| 南汇区| 三穗县| 家居| 云和县| 获嘉县| 定结县| 南木林县| 黑河市| 东乌珠穆沁旗| 衡阳市| 新巴尔虎左旗| 高青县| 保亭| 项城市|