国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python爬蟲框架Scrapy常用命令總結

2020-02-15 22:32:40
字體:
來源:轉載
供稿:網友

本文實例講述了Python爬蟲框架Scrapy常用命令。分享給大家供大家參考,具體如下:

在Scrapy中,工具命令分為兩種,一種為全局命令,一種為項目命令。

全局命令不需要依靠Scrapy項目就可以在全局中直接運行,而項目命令必須要在Scrapy項目中才可以運行

全局命令

全局命令有哪些呢,要想了解在Scrapy中有哪些全局命令,可以在不進入Scrapy項目所在目錄的情況下,運行scrapy-h,如圖所示:

可以看到,此時在可用命令在終端下展示出了常見的全局命令,分別為fetch、runspider、settings、shell、startproject、version、view。

fetch命令

fetch命令主要用來顯示爬蟲爬取的過程.如下圖所示:

在使用fetch命令時,同樣可以使用某些參數進行相應的控制。那么fetch有哪些相關參數可以使用呢?我們可以通過scrpy fetch -h列出所有可以使用的fetch相關參數。比如我們可以使用–headers顯示頭信息,也可以使用–nolog控制不顯示日志信息,還可以使用–spider=SPIDER參數來控制使用哪個爬蟲,通過–logfile=FILE指定存儲日志信息的文件,通過–loglevel=LEVEL控制日志等級。舉個栗子:

# 顯示頭信息,并且不顯示日志信息scrpay -fetch --headers --nolog http://www.baidu.com

sunspider命令

通過runspider命令可以不依托scrapy的爬蟲項目,直接運行一個爬蟲文件

# first.py為自定義的一個爬蟲文件scrapy runspider first.py

settings命令

在scrapy項目所在的目錄中使用settings命令查看的使用對應的項目配置信息,如果在scrapy項目所在的目錄外使用settings命令查看的Scrapy默認的配置信息

# 在項目中使用此命令打印的為BOT_NAME對應的值,即scrapy項目名稱。# 在項目外使用此命令打印的為scrapybotscrapy settings --get BOT_NAME

shell命令

通過shell命令可以啟動Scrapy的交互終端。

Scrapy的交互終端經常在開發以及調試的時候用到,使用Scrapy的交互終端可以實現在不啟動Scrapy爬蟲的情況下,對網站響應進行調試,同樣,在該交互終端下,我們也可以寫一些Python代碼進行相應測試。

在>>>后面可以輸入交互命令以及相應的代碼

startproject命令

用于創建scrapy項目

version命令

查看scrapy版本

view命令

用于下載某個網頁,然后通過瀏覽器查看

項目命令

bench命令

測試本地硬件的性能

scrapy bench            
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 多伦县| 阳山县| 贵德县| 高雄县| 巴彦淖尔市| 林州市| 焦作市| 麻阳| 红桥区| 宝兴县| 五常市| 永兴县| 吉木乃县| 潢川县| 宁国市| 凤翔县| 内丘县| 安吉县| 榆树市| 石林| 柳州市| 四会市| 嵊泗县| 新和县| 汤阴县| 黑河市| 信阳市| 平昌县| 元谋县| 淅川县| 南部县| 苏尼特左旗| 闸北区| 台山市| 陕西省| 寻甸| 白山市| 桐乡市| 陇川县| 洪江市| 东丰县|