国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python抓取豆瓣圖片并自動保存示例學(xué)習(xí)

2020-02-23 05:03:22
字體:
供稿:網(wǎng)友

環(huán)境Python 2.7.6,BS4,在powershell或命令行均可運行。請確保安裝了BS模塊

代碼如下:
# -*- coding:utf8 -*-
# 2013.12.36 19:41 wnlo-c209
# 抓取dbmei.com的圖片。

from bs4 import BeautifulSoup
import os, sys, urllib2

# 創(chuàng)建文件夾,昨天剛學(xué)會
path = os.getcwd()          # 獲取此腳本所在目錄
new_path = os.path.join(path,u'豆瓣妹子')
if not os.path.isdir(new_path):
 os.mkdir(new_path)


def page_loop(page=0):
 url = 'http://www.dbmeizi.com/?p=%s' % page
 content = urllib2.urlopen(url)

 soup = BeautifulSoup(content)

 my_girl = soup.find_all('img')  

    # 加入結(jié)束檢測,寫的不好....
 if my_girl ==[]:
  print u'已經(jīng)全部抓取完畢'
  sys.exit(0)

 print u'開始抓取'
 for girl in my_girl:
  link = girl.get('src')
  flink = 'http://www.dbmeizi.com/' + link

  print flink
  content2 = urllib2.urlopen(flink).read()
  with open(u'豆瓣妹子'+'/'+flink[-11:],'wb') as code:   #在OSC上現(xiàn)學(xué)的
   code.write(content2)
 page = int(page) + 1
 print u'開始抓取下一頁'
 print 'the %s page' % page
 page_loop(page)

page_loop().

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 称多县| 麟游县| 桂东县| 青铜峡市| 黄梅县| 宜阳县| 沾化县| 沿河| 兴安盟| 浦江县| 锡林浩特市| 滁州市| 海盐县| 盱眙县| 吴桥县| 南木林县| 龙里县| 确山县| 沛县| 陆良县| 南丰县| 神木县| 本溪市| 灵山县| 长丰县| 潮安县| 鄂托克前旗| 武邑县| 房产| 阜阳市| 扎鲁特旗| 五台县| 枣庄市| 牡丹江市| 体育| 溆浦县| 江源县| 富顺县| 漾濞| 萍乡市| 蒲城县|