国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python實現的批量下載RFC文檔

2020-02-23 00:17:53
字體:
來源:轉載
供稿:網友

RFC文檔有很多,有時候在沒有聯網的情況下也想翻閱,只能下載一份留存本地了。
看了看地址列表,大概是這個范圍:
http://www.networksorcery.com/enp/rfc/rfc1000.txt
...
http://www.networksorcery.com/enp/rfc/rfc6409.txt

哈哈,很適合批量下載,第一個想到的就是迅雷……
可用的時候發現它只支持三位數的擴展(用的是迅雷7),我想要下的剛好是四位數……
郁悶之下萌生自己做一個的想法!
這東西很適合用python做,原理很簡單,代碼也很少,先讀為快。
代碼如下:
代碼如下:
#! /usr/bin/python
'''
  File      : getRFC.py
  Author    : Mike
  E-Mail    : Mike_Zhang@live.com
'''
import urllib,os,shutil,time

def downloadHtmlPage(url,tmpf = ''):
    i = url.rfind('/')
    fileName = url[i+1:]
    if tmpf : fileName = tmpf
    print url,"->",fileName
    urllib.urlretrieve(url,fileName)
    print 'Downloaded ',fileName   
    time.sleep(0.2)
    return fileName
   
# http://www.networksorcery.com/enp/rfc/rfc1000.txt
# http://www.networksorcery.com/enp/rfc/rfc6409.txt
if __name__ == '__main__':
    addr = 'http://www.networksorcery.com/enp/rfc'   
    dirPath = "RFC"
    #startIndex = 1000
    startIndex = int(raw_input('start : '))
    #endIndex = 6409
    endIndex = int(raw_input('end : '))
    if startIndex > endIndex :
        print 'Input error!'       
    if False == os.path.exists(dirPath):
        os.makedirs(dirPath)   
    fileDownloadList = []
    logFile = open("log.txt","w")
    for i in range(startIndex,endIndex+1):
        try:           
            t_url = '%s/rfc%d.txt' % (addr,i)
            fileName = downloadHtmlPage(t_url)
            oldName = './'+fileName
            newName = './'+dirPath+'/'+fileName
            if True == os.path.exists(oldName):
                shutil.move(oldName,newName)

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 蒙山县| 休宁县| 高要市| 南郑县| 从江县| 上虞市| 句容市| 务川| 商城县| 石家庄市| 新郑市| 堆龙德庆县| 清丰县| 安丘市| 台江县| 宕昌县| 金湖县| 黄骅市| 富蕴县| 安顺市| 海丰县| 留坝县| 霍城县| 宁德市| 合江县| 霸州市| 库尔勒市| 嘉鱼县| 云龙县| 民乐县| 天水市| 晋州市| 吉安县| 巫山县| 北流市| 昌江| 广丰县| 若尔盖县| 商都县| 锡林浩特市| 即墨市|