国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

python爬圖

2019-11-14 17:04:44
字體:
來源:轉載
供稿:網友

閑的無事,看著知乎里種種python優點,按捺不住,裝起python3.4。

網上找了點爬行圖片的代碼,修改至兼容3.4,成功爬行指定url所有jpg圖片,代碼段如下:

import osimport urllibimport urllib.requestimport re#爬行圖片download_path = os.path.dirname(os.path.abspath(__file__))class spider(object):    def __init__(self, url):        self.url = url    def parse(self,content):        pattern = 'src="(http://.*/.jpg)/s*"'        matchs = re.findall(pattern,content,re.M)        return matchs        def downloads(self,urls):        d_path = download_path + "/test"        if not os.path.exists(d_path):            os.mkdir(d_path)        for url in urls:            filename = url.split("/")[-1]            PRint (url)            print ("Downloads %s" % (filename))            output = "%s/%s" % (d_path, filename)            urllib.request.urlretrieve(url,output)               def run(self):        d_url = self.url        fd = urllib.request.urlopen(d_url)        try:            content = fd.read()            content = content.decode("UTF-8")            urls = self.parse(content)            self.downloads(urls)        finally:            fd.close()if __name__ == "__main__":    sp = spider("http://news.cnfol.com/img/20150814/17638.shtml")    sp.run()

 


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 轮台县| 秭归县| 石柱| 吴江市| 自治县| 都匀市| 安岳县| 凤凰县| 永清县| 乐山市| 鸡西市| 泽州县| 新野县| 始兴县| 剑阁县| 海淀区| 家居| 上犹县| 龙岩市| 桦川县| 松溪县| 赞皇县| 湖南省| 宜州市| 壶关县| 镇坪县| 新昌县| 大姚县| 舟山市| 双城市| 乌鲁木齐县| 湟中县| 长岭县| 珲春市| 边坝县| 荥阳市| 合作市| 台北县| 富蕴县| 澜沧| 曲松县|