国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python使用scrapy采集數據過程中放回下載過大頁面的方法

2020-02-23 00:36:43
字體:
來源:轉載
供稿:網友

本文實例講述了Python使用scrapy采集數據過程中放回下載過大頁面的方法。分享給大家供大家參考。具體分析如下:

添加以下代碼到settings.py,myproject為你的項目名稱
代碼如下:DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.LimitSizeHTTPClientFactory'

自定義限制下載過大頁面的模塊
代碼如下:MAX_RESPONSE_SIZE = 1048576 # 1Mb
from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter
class LimitSizePageGetter(ScrapyHTTPPageGetter):
    def handleHeader(self, key, value):
        ScrapyHTTPPageGetter.handleHeader(self, key, value)
        if key.lower() == 'content-length' and int(value) > MAX_RESPONSE_SIZE:
            self.connectionLost('oversized')
class LimitSizeHTTPClientFactory(ScrapyHTTPClientFactory):
     protocol = LimitSizePageGetter

希望本文所述對大家的Python程序設計有所幫助。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 三穗县| 贵定县| 金坛市| 江达县| 乌海市| 安图县| 德江县| 郯城县| 沭阳县| 佳木斯市| 阜康市| 洞头县| 清流县| 黑水县| 肥乡县| 固阳县| 渝中区| 新龙县| 垦利县| 芮城县| 区。| 彝良县| 资阳市| 山东省| 布尔津县| 肥东县| 苍梧县| 宣武区| 宁陵县| 荥经县| 武隆县| 平塘县| 彭山县| 武城县| 建昌县| 台南县| 枣阳市| 越西县| 乐东| 麦盖提县| 淮安市|