国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python網頁解析利器BeautifulSoup安裝使用介紹

2020-02-23 00:22:39
字體:
來源:轉載
供稿:網友

python解析網頁,無出BeautifulSoup左右,此是序言

安裝

BeautifulSoup4以后的安裝需要用eazy_install,如果不需要最新的功能,安裝版本3就夠了,千萬別以為老版本就怎么怎么不好,想當初也是千萬人在用的啊。安裝很簡單
代碼如下:
$ wget "http://www.crummy.com/software/BeautifulSoup/download/3.x/BeautifulSoup-3.2.1.tar.gz" 
$ tar zxvf BeautifulSoup-3.2.1.tar.gz 

然后把里面的BeautifulSoup.py這個文件放到你python安裝目錄下的site-packages目錄下

site-packages是存放Python第三方包的地方,至于這個目錄在什么地方呢,每個系統不一樣,可以用下面的方式找一下,基本上都能找到
代碼如下:
$ sudo find / -name "site-packages" -maxdepth 5 -type d 
$ find ~ -name "site-packages" -maxdepth 5 

當然如果沒有root權限就查找當前用戶的根目錄
代碼如下:
$ find ~ -name "site-packages" -maxdepth 5 -type d 

如果你用的是Mac,哈哈,你有福了,我可以直接告訴你,Mac的這個目錄在/Library/Python/下,這個下面可能會有多個版本的目錄,沒關系,放在最新的一個版本下的site-packages就行了。使用之前先import一下
代碼如下:
from BeautifulSoup import BeautifulSoup 

使用

在使用之前我們先來看一個實例
現在給你這樣一個頁面
代碼如下:
http://movie.douban.com/tag/%E5%96%9C%E5%89%A7

它是豆瓣電影分類下的喜劇電影,如果讓你找出里面評分最高的100部,該怎么做呢
好了,我先曬一下我做的,鑒于本人在CSS方面處于小白階段以及天生沒有美術細菌,界面做的也就將就能看下,別吐

接下來我們開始學習BeautifulSoup的一些基本方法,做出上面那個頁面就易如反掌了

鑒于豆瓣那個頁面比較復雜,我們先以一個簡單樣例來舉例,假設我們處理如下的網頁代碼
代碼如下:
<html> 
<head><title>Page title</title></head> 
<body> 
    <p id="firstpara" align="center"> 
    This is paragraph 
        <b> 
        one 
        </b> 
        . 
    </p> 
    <p id="secondpara" align="blah"> 
    This is paragraph 
        <b> 
        two 
        </b> 

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 西盟| 汶上县| 隆回县| 峨眉山市| 随州市| 徐水县| 甘孜| 广州市| 河津市| 余姚市| 绥中县| 陕西省| 永福县| 英德市| 西昌市| 吉首市| 禹城市| 普宁市| 乐清市| 日土县| 崇州市| 寻甸| 林西县| 营山县| 溧水县| 富宁县| 姜堰市| 修武县| 开远市| 北海市| 莲花县| 潍坊市| 九江市| 大同市| 屯昌县| 弋阳县| 镇巴县| 平山县| 宝应县| 微山县| 荥阳市|