由于畢業設計的要求,需要在網站上抓取大量的數據,那么使用Scrapy框架可以讓這一過程變得簡單不少,畢竟Scrapy是一個為了爬去網站數據、提取結構性數據而編寫的應用框架。于是,便開始了我的安裝Scrapy框架之旅。可以說這個過程并不是很愉快,各種錯誤各種出,不過到最后,終于安裝上了Scrapy框架。下面總結一下我的Scrapy框架的安裝。
1.安裝python2.7
由于Scrapy不支持Python3.0,于是我卸載了Python3.0,又重新安裝了Python2.7(python2.7安裝包),在安裝Python2.7的時候,會有一個自動設置環境變量的選項,建議在這里將選項選上,省下后期自己添加環境變量。我們后期自己添加環境變量,就是根據自己實際安裝的路徑,在系統的環境變量path中添加這兩條語句就可以。

在配置完環境之后,我們測試一下我們是否安裝配置環境成功。只要在cmd中輸入 python –version ,然后能夠顯示正確的python版本就可以了。如果未能顯示,則重啟一下cmd試試。

2.安裝pywin32
在安裝配置好python2.7之后,我們還不能直接安裝Scrapy,我們首先需要安裝Scrapy依賴的幾個工具。接下來安裝pywin32(pywin32安裝包),這個軟件安裝的時候一直next就可以了。
3.安裝pip
pip實際上一款比較方便的在線軟件安裝工具,類似于easy install,我們現在安裝pip,在之后的軟件安裝的時候我們就可以使用 pip install 命令了。首先我們要下載get-pip.py(get-pip.py文件) ,下載完成之后,我們在cmd下進行安裝,首先切換到文件所在目錄,然后輸入python get-pip.py語句,便可以進行安裝了,但是最頭疼的問題出現了,由于該文件會將一些配置文件自動寫入到我們的C盤用戶文件目錄下,而我的用戶目錄是中文名,就會產生編碼異常。

在查找一番資料之后,終于將問題解決了,為了解決中文路徑的問題,我們只需要在 D:/python27/Lib/site-packages的目錄下新建一個名為
sitecustomize.py的文件即可。

然后在文件內輸入以下代碼:
import sysreload(sys)sys.setdefaultencoding('gbk')當然不一定一定要設置為gbk編碼,這個根據自己的電腦的編碼來設置。這樣我們的中文路徑問題就算解決了,我們在重啟cmd,在執行安裝pip語句之后,pip便順利完成了。安裝完成之后,我們可以進行一下檢驗,在cmd中輸入pip –version,如果顯示正確的版本號則說明正確。
新聞熱點
疑難解答