国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

<rp id="xrsoc"></rp>

<tt id="xrsoc"><option id="xrsoc"></option></tt>

<var id="xrsoc"></var>

<nobr id="xrsoc"></nobr>

<sup id="xrsoc"><ins id="xrsoc"></ins></sup>

<sup id="xrsoc"></sup>

首頁 > 編程 > Python > 正文

Python打印scrapy蜘蛛抓取樹結(jié)構(gòu)的方法

2020-02-23 00:36:11

字體：大中小

來源：轉(zhuǎn)載

供稿：網(wǎng)友

本文實(shí)例講述了Python打印scrapy蜘蛛抓取樹結(jié)構(gòu)的方法。分享給大家供大家參考。具體如下：

通過下面這段代碼可以一目了然的知道scrapy的抓取頁面結(jié)構(gòu)，調(diào)用也非常簡(jiǎn)單

#!/usr/bin/env pythonimport fileinput, refrom collections import defaultdictdef print_urls(allurls, referer, indent=0):  urls = allurls[referer]  for url in urls:    print ' '*indent + referer    if url in allurls:      print_urls(allurls, url, indent+2)def main():  log_re = re.compile(r'<GET (.*?)> /(referer: (.*?)/)')  allurls = defaultdict(list)  for l in fileinput.input():    m = log_re.search(l)    if m:      url, ref = m.groups()      allurls[ref] += [url]  print_urls(allurls, 'None')main()

希望本文所述對(duì)大家的Python程序設(shè)計(jì)有所幫助。

上一篇：Python HTMLParser模塊解析html獲取url實(shí)例

下一篇：Python遍歷zip文件輸出名稱時(shí)出現(xiàn)亂碼問題的解決方法

學(xué)習(xí)交流

筆記本開機(jī)提示error loading os錯(cuò)誤的問

筆記本開機(jī)提示error loading os錯(cuò)誤的問題怎么解決...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關(guān)注

新聞熱點(diǎn)

雷軍：小米成立10年收入突破2000億

2020-02-23 14:27:16

特斯拉：無鈷，不代表一定是磷酸鐵鋰電池

2020-02-22 09:45:28

豌豆莢宣布業(yè)務(wù)調(diào)整將于2月28日關(guān)閉PC版在線服務(wù)

2020-02-22 09:42:20

小米集團(tuán)宣布人事任命：聯(lián)合創(chuàng)始人王川擔(dān)任小米集團(tuán)首席戰(zhàn)略官

2020-02-22 09:39:07

外媒：高通康寧合作開發(fā)毫米波5G室內(nèi)解決方案

2020-02-21 16:46:56

華為終端產(chǎn)品與戰(zhàn)略線上發(fā)布會(huì)：5G全場(chǎng)景，共聯(lián)未來

2020-02-20 10:01:00

疑難解答

圖片精選

網(wǎng)友關(guān)注

主站蜘蛛池模板：德阳市| 砚山县| 长治市| 库车县| 苏尼特右旗| 航空| 荥阳市| 建水县| 南华县| 监利县| 朝阳县| 望奎县| 灵寿县| 合阳县| 普安县| 耒阳市| 香格里拉县| 边坝县| 吴江市| 祥云县| 台中县| 德州市| 平罗县| 阜平县| 德兴市| 青海省| 云浮市| 铜陵市| 垦利县| 清镇市| 论坛| 蒙自县| 启东市| 曲沃县| 浑源县| 汶川县| 辉县市| 墨玉县| 北票市| 安吉县| 达州市|

<sup id="e9xxq"><ruby id="e9xxq"></ruby></sup>

<nobr id="e9xxq"></nobr>

<noscript id="e9xxq"></noscript><noscript id="e9xxq"></noscript><menu id="e9xxq"></menu>

<noscript id="e9xxq"></noscript>

<thead id="e9xxq"></thead>

<thead id="e9xxq"><samp id="e9xxq"><em id="e9xxq"></em></samp></thead>

<sup id="e9xxq"><option id="e9xxq"></option></sup>