基于scrapy的redis安裝和配置方法

2020-02-15 21:49:34

字體：大中小

供稿：網(wǎng)友

在定向爬蟲的制作過(guò)程中，使用分布式爬取技術(shù)可以顯著提高爬取效率。而 Redis 配合 Scrapy 是實(shí)現(xiàn)分布式爬取的基礎(chǔ)。

Redis 是一個(gè)高性能的 Key-Value 數(shù)據(jù)庫(kù)，它把數(shù)據(jù)保存在內(nèi)存里。因此可以有非?？斓臄?shù)據(jù)讀寫速度。

scrapy-redis 的安裝

pip install scrapy-rediseasy_install scrapy-redis

下載

http://redis.io/download

版本推薦

stable 3.0.2

運(yùn)行redis

redis-server redis.conf

清空緩存

redis-cli flushdb

scrapy配置redis

settings.py配置redis

SCHEDULER = "scrapy_redis.scheduler.Scheduler"SCHEDULER_PERSIST = TrueSCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'REDIS_URL = None # 一般情況可以省去REDIS_HOST = '127.0.0.1' # 也可以根據(jù)情況改成 localhostREDIS_PORT = 6379

在scrapy中使用scrapy-redis

spider 繼承RedisSpider

class tempSpider(RedisSpider) name = "temp"redis_key = ''temp:start_url"

以上這篇基于scrapy的redis安裝和配置方法就是小編分享給大家的全部?jī)?nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持武林站長(zhǎng)站。

上一篇：ubuntu17.4下為python和python3裝上pip的方法

下一篇：pip install urllib2不能安裝的解決方法

學(xué)習(xí)交流

如何重啟打印機(jī)打印服務(wù)

如何重啟打印機(jī)打印服務(wù)...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關(guān)注

新聞熱點(diǎn)

明兮語(yǔ)文停止運(yùn)營(yíng) 發(fā)展資金鏈斷裂

2020-02-16 09:52:44

2006年李俊編寫了“熊貓燒香”電腦病毒，現(xiàn)在過(guò)得怎么樣？

2020-02-15 15:53:44

谷歌合并Alphabet旗下子公司Jigsaw，未來(lái)會(huì)如何發(fā)展？

2020-02-11 22:02:38

NASA說(shuō)今天地球引力最小能讓掃帚立起來(lái)？原因很簡(jiǎn)單

2020-02-11 21:45:12

TCL集團(tuán)宣布今日起正式更名為“TCL科技”

2020-02-07 10:36:18

黑莓曲終落，情懷價(jià)幾何？

2020-02-06 12:16:44

疑難解答

圖片精選

網(wǎng)友關(guān)注

国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

基于scrapy的redis安裝和配置方法