国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發(fā) > Python > 正文

Python基于BeautifulSoup和requests實現(xiàn)的爬蟲功能示例

2024-09-09 19:02:49
字體:
來源:轉載
供稿:網(wǎng)友

本文實例講述了Python基于BeautifulSoup和requests實現(xiàn)的爬蟲功能。分享給大家供大家參考,具體如下:

爬取的目標網(wǎng)頁:http://www.qianlima.com/zb/area_305/

這是一個招投標網(wǎng)站,我們使用python腳本爬取紅框中的信息,包括鏈接網(wǎng)址、鏈接名稱、時間等三項內(nèi)容。

使用到的Python庫:BeautifulSoup、requests

代碼如下:

# -*- coding:utf-8 -*-import requestsfrom bs4 import BeautifulSoupurl = 'http://www.qianlima.com/zb/area_305/'user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'headers = { 'User-Agent' : user_agent}r = requests.get(url,headers=headers)#連接content = r.text#獲取內(nèi)容,自動轉碼unicodesoup = BeautifulSoup(content,"lxml")tags1 = soup.select('div .shixian_zhaobiao')tag1 = tags1[0]tag2 = tag1.find(name = 'dl')tags2 = tag2.find_all(name = 'a')tags3 = tag2.find_all(name = 'dd')for tag in tags2: print tag.get('href') print tag.string print tag.next_element.next_element.string

運行結果如下

更多關于Python相關內(nèi)容可查看本站專題:《Python Socket編程技巧總結》、《Python正則表達式用法總結》、《Python數(shù)據(jù)結構與算法教程》、《Python函數(shù)使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》

希望本文所述對大家Python程序設計有所幫助。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 务川| 枣强县| 马山县| 读书| 普宁市| 平度市| 廊坊市| 忻城县| 临漳县| 邮箱| 灵石县| 旬阳县| 孝义市| 安宁市| 托里县| 台南县| 合川市| 游戏| 黎川县| 高阳县| 文登市| 日土县| 台北市| 浙江省| 蒙自县| 峨山| 古交市| 响水县| 报价| 精河县| 普洱| 雷波县| 大竹县| 合作市| 平利县| 沛县| 闵行区| 闵行区| 湖口县| 顺昌县| 普兰店市|