国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > Python > 正文

python爬蟲(chóng)獲取百度首頁(yè)內(nèi)容教學(xué)

2020-02-16 00:17:26
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

由傳智播客教程整理,我們這里使用的是python2.7.x版本,就是2.7之后的版本,因?yàn)閜ython3的改動(dòng)略大,我們這里不用它?,F(xiàn)在我們嘗試一下url和網(wǎng)絡(luò)爬蟲(chóng)配合的關(guān)系,爬瀏覽器首頁(yè)信息。

1、首先我們創(chuàng)建一個(gè)urllib2_test01.py,然后輸入以下代碼:

2、最簡(jiǎn)單的獲取一個(gè)url的信息代碼居然只需要4行,執(zhí)行寫(xiě)的python代碼:

3、之后我們會(huì)看到一下的結(jié)果

4、

實(shí)際上,如果我們?cè)跒g覽器上打開(kāi)網(wǎng)頁(yè)主頁(yè)的話,右鍵選擇“查看源代碼”,你會(huì)發(fā)現(xiàn),跟我們剛打印出來(lái)的是一模一樣的。也就是說(shuō),上面的4行代碼就已經(jīng)幫我們把百度的首頁(yè)和全部代碼爬了下來(lái)了 。

5、下面我們介紹一下這四行代碼,第一行如下圖,這個(gè)就是將urllib2組件進(jìn)入進(jìn)來(lái),供給我們使用。

6、圖片下面這步驟是調(diào)用urllib2庫(kù)中的urlopen方法,該方法接受一個(gè)url地址,然后將請(qǐng)求后的得到的回應(yīng)封裝到一個(gè)叫respones對(duì)象當(dāng)中。

7、最后這里,是調(diào)用response對(duì)象的read()方法,將請(qǐng)求的回應(yīng)內(nèi)容以字符串的形式給html變量。最后的print html就是將字符串打出來(lái),所以說(shuō)一個(gè)基本的url請(qǐng)求是對(duì)應(yīng)的python代碼是很簡(jiǎn)單的。

總結(jié):以上就是關(guān)于利用python爬蟲(chóng)獲取百度信息的步驟內(nèi)容,感謝大家的學(xué)習(xí)和對(duì)武林站長(zhǎng)站的支持。

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 大关县| 汽车| 紫阳县| 婺源县| 凤庆县| 丽江市| 慈溪市| 卢龙县| 合川市| 尚义县| 邵武市| 凉山| 三门县| 长乐市| 邹平县| 若尔盖县| 伽师县| 襄垣县| 广宗县| 大荔县| 辰溪县| 闸北区| 青海省| 滦平县| 固镇县| 原平市| 柳河县| 普兰县| 大厂| 岳阳市| 桂林市| 彭山县| 察隅县| 广汉市| 五大连池市| 江源县| 荔浦县| 博罗县| 会同县| 鞍山市| 宝兴县|