国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > Python > 正文

python處理中文編碼和判斷編碼示例

2020-02-23 05:12:46
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

下面所說(shuō)的都是針對(duì)python2.7

代碼如下:
#coding:utf-8
#chardet 需要下載安裝

import chardet
#抓取網(wǎng)頁(yè)html
line = "http://www.***.com"
html_1 = urllib2.urlopen(line,timeout=120).read()
#print html_1
encoding_dict = chardet.detect(html_1)
#print encoding
web_encoding = encoding_dict['encoding']
if web_encoding == 'utf-8' or web_encoding == 'UTF-8':

  html = html_1
else :
   html = html_1.decode('gbk','ignore').encode('utf-8')

#有以上處理,整個(gè)html就不會(huì)是亂碼。

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 泰来县| 外汇| 承德县| 沧州市| 永寿县| 于田县| 永仁县| 古交市| 龙州县| 正蓝旗| 汶上县| 崇义县| 盘锦市| 定襄县| 沁水县| 奇台县| 芒康县| 河东区| 大方县| 张家界市| 灵宝市| 郯城县| 威信县| 井冈山市| 绥棱县| 高唐县| 筠连县| 榆树市| 洮南市| 泗阳县| 上思县| 尤溪县| 曲周县| 缙云县| 拜城县| 柳林县| 砀山县| 鹿邑县| 潼关县| 醴陵市| 禄劝|