国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

<td id="1vtrr"></td>

<td id="1vtrr"><tr id="1vtrr"><th id="1vtrr"></th></tr></td>

首頁 > 編程 > Python > 正文

記錄使用python時遇到的中文編碼問題與解決方法

2019-11-06 07:54:56

字體：大中小

來源：轉(zhuǎn)載

供稿：網(wǎng)友

記錄使用python時遇到的中文編碼問題與解決方法

剛接觸python時，師兄就教導(dǎo)我們在每個py文件的第一行要加上# coding=utf-8這句話啦

在一開始的處理時并沒有遇到問題，可隨著處理的東西越來越多，各種各樣的問題就出現(xiàn)了，為了盡量避免這些問題首先是把Pycharm的編碼統(tǒng)一了，如圖

如果是處理獲取到的網(wǎng)頁源代碼，不要偷懶，先看看源代碼的編碼，就像下圖中的charset=一般來說就是它的編碼了如果網(wǎng)頁源代碼的編碼和自己編譯器的不同，會出現(xiàn)中文亂碼，那么該怎么解決呢？假設(shè)網(wǎng)頁源代碼是GB2312而想要的是utf-8，則可以用這句代碼 s.decode('GB2312').encode('utf-8') 因為字符串在Python內(nèi)部的表示是unicode編碼. 因此，在做編碼轉(zhuǎn)換時，通常需要以unicode作為中間編碼，即先將其他編碼的字符串解碼（decode）成unicode，再從unicode編碼（encode）成另一種編碼。

可是！就是有些網(wǎng)頁啊～口不對心，charset顯示的編碼和實際編碼跟不一樣，怪不得有UnicodeEncodeError[捂臉] 這時候就可以用下面的代碼來查看字符串的真實編碼，然后再decode和encode就好啦

import chardetPRint chardet.detect(data) # data是未知編碼的字符串

上一篇：Python 日期和時間

下一篇：Python 文件操作

學(xué)習(xí)交流

索泰發(fā)布一款GTX 1070 Mini迷你版本:小機(jī)

索泰發(fā)布一款GTX 1070 Mini迷你版本:小機(jī)箱大愛...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關(guān)注

新聞熱點

榮耀總裁趙明烏鎮(zhèn)演講：榮耀首款5G手機(jī)V30下月發(fā)布

2019-10-23 09:17:05

搜狐張朝陽：回歸媒體是搜狐重新崛起的關(guān)鍵

2019-10-21 09:20:02

華為輪值董事長郭平：虛擬技術(shù)創(chuàng)造現(xiàn)實價值

2019-10-21 09:00:12

滴滴英文服務(wù)上線兩周年用戶已超200萬

2019-09-26 08:57:12

華為推出全球至快AI訓(xùn)練集群Atlas900

2019-09-25 08:46:36

馬斯克：特斯拉正組建中國技術(shù)團(tuán)隊

2019-09-25 08:15:43

疑難解答

圖片精選

網(wǎng)友關(guān)注

主站蜘蛛池模板：额济纳旗| 平湖市| 肇庆市| 松阳县| 天气| 乌鲁木齐县| 长治县| 土默特左旗| 宁陕县| 慈利县| 康平县| 镇雄县| 扶余县| 土默特左旗| 沅陵县| 永平县| 台北县| 东兴市| 通化市| 乌拉特中旗| 华蓥市| 郸城县| 霍山县| 普陀区| 城固县| 志丹县| 辽阳市| 丰宁| 沂南县| 苗栗市| 渝北区| 舒兰市| 当阳市| 杭州市| 平武县| 五指山市| 黔西| 宣威市| 海伦市| 浠水县| 和硕县|

^{<noscript id="2qdix"></noscript>}