国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python urllib爬取百度云連接的實例代碼

2020-02-16 01:43:10
字體:
來源:轉載
供稿:網友

翻看自己以前寫的程序,發現寫過一個爬取盤多多百度云資源的東西,完全是當時想看變形金剛才自己寫的,而且當時第一次接觸python大概寫了有2天才搞出來這個程序,學習python語言,可以看得出來那時候的代碼寫的真的low。雖然現在也不怎么樣,哈哈,一直學習中,不做過多解釋,上圖上代碼,因為變量的聲明是什么我自己也忘了(手動傲嬌),連寫入文件當時都不會哈哈哈哈哈哈哈哈,也不知道class中可以通過init初始化,唉學習python原來我學到了這么多東西,感謝python

from bs4 import BeautifulSoupimport urllibimport requestsimport readr =[]''''對搜素資源名字進行url編碼'''search_text =raw_input('請輸入搜索資源名:')search_text = search_text.decode('gbk')search_text = search_text.encode('utf-8')search_text = urllib.quote(search_text)''''獲取文件地址'''home = urllib.urlopen('http://www.panduoduo.net/s/name/'+search_text)'''獲取百度云地址'''def getbaidu(adr):  for i in adr:    url = urllib.urlopen('http://www.panduoduo.net'+i)    bs = BeautifulSoup(url)    bs1 = bs.select('.dbutton2')    href = re.compile('http/%(/%|/d|/w|////|//|/.)*')    b = href.search(str(bs1))    name = str(bs.select('.center')).decode('utf-8')    text1 = re.compile('/<h1/sclass/=/"center"/>[/d|/w|/D|/W]*/</h1/>')    text2 = text1.search(name)    rag1 = re.compile('/>[/d|/w|/D|/W]*/<')    if text2:      text3 = rag1.search(text2.group())      if text3:        print text3.group()    if b:      text = urllib.unquote(str(b.group())).decode('utf-8')      print text'''初始化'''def init(adr):  soup = BeautifulSoup(home)  soup = soup.select('.row')  pattern = re.compile('//r///d+')  for i in soup:    i = str(i)    adress = pattern.search(i)    adress = adress.group()    adr.append(adress)print 'running---------'    init(adr)getbaidu(adr)

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 扎赉特旗| 承德县| 贵阳市| 洮南市| 崇礼县| 武宣县| 桃江县| 普洱| 乐平市| 平度市| 都昌县| 新野县| 襄城县| 来凤县| 廉江市| 缙云县| 石棉县| 海淀区| 资溪县| 时尚| 抚州市| 衡阳县| 北流市| 卢湾区| 长兴县| 渑池县| 通化县| 万全县| 丹棱县| 花垣县| 洪洞县| 石河子市| 泾川县| 全南县| 格尔木市| 云霄县| 宜黄县| 长宁区| 兰州市| 鄯善县| 澄迈县|