国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

<small id="eluxx"><dl id="eluxx"><noframes id="eluxx"></noframes></dl></small>

<td id="eluxx"><tr id="eluxx"></tr></td>

首頁 > 編程 > Python > 正文

Python使用requests及BeautifulSoup構建爬蟲實例代碼

2020-02-22 22:58:43

字體：大中小

來源：轉載

供稿：網友

本文研究的主要是Python使用requests及BeautifulSoup構建一個網絡爬蟲，具體步驟如下。

功能說明

在Python下面可使用requests模塊請求某個url獲取響應的html文件，接著使用BeautifulSoup解析某個html。

案例

假設我要http://maoyan.com/board/4貓眼電影的top100電影的相關信息，如下截圖：

獲取電影的標題及url。

安裝requests和BeautifulSoup

使用pip工具安裝這兩個工具。

pip install requests

pip install beautifulsoup4

程序

__author__ = 'Qian Yang'# -*- coding:utf-8 -*-import requestsfrom bs4 import BeautifulSoupdef get_one_page(url):  response= requests.get(url)  if response.status_code == 200:    return response.content.decode("utf8","ignore").encode("gbk","ignore")#采用BeautifulSoup解析def bs4_paraser(html):  all_value = []  value = {}  soup = BeautifulSoup(html,'html.parser')  # 獲取每一個電影  all_div_item = soup.find_all('div', attrs={'class': 'movie-item-info'})  for r in all_div_item:    # 獲取電影的名稱和url    title = r.find_all(name="p",attrs={"class":"name"})[0].string    movie_url = r.find_all('p', attrs={'class': 'name'})[0].a['href']    value['title'] = title    value['movie_url'] = movie_url    all_value.append(value)    value = {}  return all_valuedef main():  url = 'http://maoyan.com/board/4'  html = get_one_page(url)  all_value = bs4_paraser(html)  print(all_value)if __name__ == '__main__':  main()

代碼測試可用，實現效果：

總結

以上就是本文關于Python使用requests及BeautifulSoup構建爬蟲實例代碼的全部內容，希望對大家有所幫助。感興趣的朋友可以繼續參閱本站其他相關專題，如有不足之處，歡迎留言指出。感謝朋友們對本站的支持！

上一篇：python實現生命游戲的示例代碼(Game of Life)

下一篇：python的re正則表達式實例代碼

學習交流

筆記本開機提示error loading os錯誤的問

筆記本開機提示error loading os錯誤的問題怎么解決...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

特斯拉：無鈷，不代表一定是磷酸鐵鋰電池

2020-02-22 09:45:28

豌豆莢宣布業務調整將于2月28日關閉PC版在線服務

2020-02-22 09:42:20

小米集團宣布人事任命：聯合創始人王川擔任小米集團首席戰略官

2020-02-22 09:39:07

外媒：高通康寧合作開發毫米波5G室內解決方案

2020-02-21 16:46:56

華為終端產品與戰略線上發布會：5G全場景，共聯未來

2020-02-20 10:01:00

阿里平頭哥含光800芯片曝光采用臺積電12nm工藝制造

2020-02-20 09:56:41

疑難解答

圖片精選

網友關注

主站蜘蛛池模板：会理县| 兴仁县| 凤凰县| 丁青县| 象州县| 襄樊市| 扶风县| 都安| 龙南县| 福贡县| 探索| 黔西县| 红安县| 郴州市| 鄂州市| 河西区| 自贡市| 临邑县| 萨迦县| 定襄县| 龙陵县| 镇江市| 隆回县| 崇礼县| 分宜县| 蓬溪县| 开远市| 呼图壁县| 闵行区| 阳西县| 麻栗坡县| 库尔勒市| 庆阳市| 亚东县| 嘉善县| 威远县| 安龙县| 永川市| 右玉县| 三穗县| 广东省|