前言
Scrapy是一個開源的網絡爬蟲框架,Python編寫的。最初設計用于網頁抓取,也可以用來提取數據使用API或作為一個通用的網絡爬蟲。是數據采集不可必備的利器。
安裝
pip install scrapy
如果使用上面的命令太慢。國內可以使用豆瓣源進行加速。
pip install -i https://pypi.douban.com/simple scrapy
注意要寫錯了,是 https://pypi.douban.com/simple 很多包都可以使用這個源進行加速,這也是pip的一個技巧,還可以使用阿里云進行加速。
安裝完成之后在命令行輸入
scrapy -v
如果出現了相應的版本號就說明安裝成功。
創建項目
目前還沒有IDE 能夠創建scrapy的項目,我們必須手動初始化項目。
1、找一個目錄
輸入命令
scrapy startproject SpiderObject
命令行出現這樣的結果說明創建成果
You can start your first spider with: cd SpiderObject scrapy genspider example example.com
去文件夾中看看

初始化項目
使用pycharm打開該項目

如果出現這個頁面就說明對了。

下面生成一個模板
打開pycharm的terminal

輸入
scrapy genspider BiduSpider http://www.baidu.com
我們的spider 包下面會多一個文件

這說明我們的spider創建成功。可以在pytharm中使用這個 強大的框架了。
以上這篇Pycharm+Scrapy安裝并且初始化項目的方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。
新聞熱點
疑難解答