国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

一則python3的簡單爬蟲代碼

2020-02-23 05:23:27
字體:
來源:轉載
供稿:網(wǎng)友

不得不說python的上手非常簡單。在網(wǎng)上找了一下,大都是python2的帖子,于是隨手寫了個python3的。代碼非常簡單就不解釋了,直接貼代碼。

代碼如下:
#test rdp
import urllib.request
import re<br>
#登錄用的帳戶信息
data={}
data['fromUrl']=''
data['fromUrlTemp']=''
data['loginId']='12345'
data['password']='12345'
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#登錄地址
#url='http://192.168.1.111:8080/loginCheck'
postdata = urllib.parse.urlencode(data)
postdata = postdata.encode('utf-8')
headers = { 'User-Agent' : user_agent }
#登錄
res = urllib.request.urlopen(url,postdata)
#取得頁面html<br>strResult=(res.read().decode('utf-8'))
#用正則表達式取出所有A標簽
p = re.compile(r'<a href="(.*?)".*?>(.*?)</a>')
for m in p.finditer(strResult):
    print (m.group(1))#group(1)是href里面的內(nèi)容,group(2)是a標簽里的文字

關于cookie、異常等處理看了一下,沒有花時間去處理,畢竟只是想通過寫爬蟲來學習python。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 武功县| 靖宇县| 博野县| 汶上县| 剑阁县| 遂溪县| 巩留县| 宜宾市| 永清县| 柞水县| 水城县| 团风县| 乐都县| 伊通| 景洪市| 汉沽区| 柏乡县| 沙湾县| 濮阳县| 广安市| 观塘区| 昔阳县| 霞浦县| 白沙| 扎鲁特旗| 肥西县| 绵竹市| 阆中市| 五寨县| 晋中市| 勐海县| 枞阳县| 麦盖提县| 神木县| 邛崃市| 庆元县| 惠水县| 建德市| 安乡县| 慈利县| 滕州市|