国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python二進制串轉換為通用字符串的方法

2020-02-15 22:29:43
字體:
來源:轉載
供稿:網友

一個小問題

今天在做一個實驗時,需要對一個包含中英文詞匯的TXT文件進行讀入和整理。

Python代碼的編碼規則為UTF-8。在讀入時,文件的每行是二進制串,形如:

b'heroes/xff.....

在對每行進一步進行處理時,要求處理對象必須為通用字符串,所以:

lineVec = str(line).strip().split('/t')

此時的lineVec的元素類型為string,但輸出是仍然是 “b'heros/xff…..” ,仍然無法擺脫二進制標志的影響。然而,尷尬的是,在后邊對以lineVec元素作為鍵的字典進行索引時,只能獲得通用字符串的鍵。所以,每次索引都以KeyError退出。

在多次嘗試之后,我發現:二進制串在經過str()函數轉化之后,已經將所有的內容都轉化成了一個通用的字符串。也就是說,“b'heros/xff……”中的所有字符都是可以用python的字符串處理手段處理的。

給定一個 word=”b'heros”,如果希望得到通用字符串形式的單詞”heros”,那么我們可以直接取字符串word的第3至最后一個字母,或將“b'”直接替換掉:

newWord = word[2:-1]#或newWord = word.replace("b'",'') #因為單引號是python中表示字符串的特殊功能字符,所以被替換的字 

符寫作'b''會報錯。需要用雙引號把單引號括起來。

在用上面的方法把字典鍵都更新了一遍之后,世界瞬間和諧了。

一些擴充

在解決上邊的問題的過程中,搜索了許多相關的解決方法,對python中二進制串與通用字符串之間的轉換有了一定的了解。但都是關于純英語字符串轉換的,對上邊的中文字符無用。用下面方法轉換中文字符串時會出現編碼錯誤。

給定通用字符串 string = ‘a string' , 需要把它轉換為二進制串時,可以直接調用字符串的內置方法:

print string>>>a stringbstring = string.encode('ascii') # encode方法,參數用來指定編碼標準print bstring>>>b'a string'string1 = bstring.decode('ascii') # encode的逆,對二進制串進行解碼print string1>>>a string

在進行文本文件讀入和解析時,經常會遇到這樣的二進制問題,希望對大家有所幫助。

以上這篇Python二進制串轉換為通用字符串的方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 教育| 安义县| 桂东县| 乌拉特中旗| 纳雍县| 镇宁| 桐乡市| 循化| 四川省| 清苑县| 金乡县| 大渡口区| 社会| 高碑店市| 武义县| 公安县| 周口市| 甘孜县| 保靖县| 乌兰察布市| 隆子县| 石台县| 海晏县| 龙陵县| 吴忠市| 朝阳市| 青州市| 马尔康县| 仪征市| 乐安县| 通山县| 汉沽区| 松原市| 八宿县| 洛扎县| 张北县| 阳高县| 鄢陵县| 五台县| 于都县| 新化县|