国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > Python > 正文

python爬蟲(chóng)爬取網(wǎng)頁(yè)表格數(shù)據(jù)

2020-02-22 23:22:51
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

用python爬取網(wǎng)頁(yè)表格數(shù)據(jù),供大家參考,具體內(nèi)容如下

from bs4 import BeautifulSoup import requests import csv import bs4   #檢查url地址 def check_link(url):  try:      r = requests.get(url)   r.raise_for_status()   r.encoding = r.apparent_encoding   return r.text  except:   print('無(wú)法鏈接服務(wù)器!!!')   #爬取資源 def get_contents(ulist,rurl):  soup = BeautifulSoup(rurl,'lxml')  trs = soup.find_all('tr')  for tr in trs:   ui = []   for td in tr:    ui.append(td.string)   ulist.append(ui)   #保存資源 def save_contents(urlist):  with open("D:/2016年中國(guó)企業(yè)500強(qiáng)排行榜.csv",'w') as f:   writer = csv.writer(f)   writer.writerow(['2016年中國(guó)企業(yè)500強(qiáng)排行榜'])   for i in range(len(urlist)):    writer.writerow([urlist[i][1],urlist[i][3],urlist[i][5]]) def main():  urli = []  url = "http://www.maigoo.com/news/463071.html"  rs = check_link(url)  get_contents(urli,rs)  save_contents(urli)  main() 

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持武林站長(zhǎng)站。

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 凤翔县| 西充县| 和田县| 黔南| 阿城市| 平阴县| 桓台县| 长海县| 神池县| 皮山县| 枣庄市| 峨山| 晋宁县| 开化县| 延安市| 平顶山市| 扶沟县| 道真| 乌拉特前旗| 睢宁县| 东安县| 渝北区| 香港| 宁晋县| 哈尔滨市| 县级市| 姚安县| 宜川县| 开阳县| 盐源县| 泸水县| 望城县| 高平市| 紫云| 祥云县| 长宁区| 延津县| 屯门区| 景德镇市| 长寿区| 潼关县|