国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python BeautifulSoup設置頁面編碼的方法

2020-02-23 00:31:59
字體:
來源:轉載
供稿:網友

在用BeautifulSoup進行抓取頁面的時候,會各種各樣的編碼錯誤。
可以通過在beautifulsoup中指定字符編碼,解決問題。
代碼如下:
import urllib2 
from BeautifulSoup import BeautifulSoup 
 
page = urllib2.urlopen('http://www.163.com'); 
soup = BeautifulSoup(page,from_encoding="gb2312") 
 
print soup.originalEncoding
print soup.prettify() 

紅色部分表示需要注意的地方。在BeautifulSoup構造器中傳入fromEncoding參數即可解決亂碼問題,當然具體參數值是什么就要看你獲取頁面的編碼是什么

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 牟定县| 龙川县| 商都县| 娄底市| 麟游县| 商水县| 樟树市| 游戏| 昭平县| 平远县| 高碑店市| 永寿县| 惠水县| 精河县| 新乐市| 依兰县| 闵行区| 高邑县| 象州县| 盖州市| 遵义市| 庐江县| 吴堡县| 怀宁县| 和政县| 连江县| 隆回县| 屏东县| 青浦区| 杭锦后旗| 余江县| 西昌市| 淮安市| 射阳县| 大同市| 奉新县| 诸城市| 清镇市| 盐津县| 墨脱县| 台东县|