国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python判斷文件和字符串編碼類型的實例

2020-02-16 11:13:32
字體:
來源:轉載
供稿:網友

python判斷文件和字符串編碼類型可以用chardet工具包,可以識別大多數的編碼類型。但是前幾天在讀取一個Windows記事本保存的txt文件時,GBK卻被識別成了KOI8-R,無解。

然后就自己寫了個簡單的編碼識別方法,代碼如下:

coding.py

# 說明:UTF兼容ISO8859-1和ASCII,GB18030兼容GBK,GBK兼容GB2312,GB2312兼容ASCIICODES = ['UTF-8', 'UTF-16', 'GB18030', 'BIG5']# UTF-8 BOM前綴字節UTF_8_BOM = b'/xef/xbb/xbf'# 獲取文件編碼類型def file_encoding(file_path): """ 獲取文件編碼類型/n :param file_path: 文件路徑/n :return: /n """ with open(file_path, 'rb') as f:  return string_encoding(f.read())# 獲取字符編碼類型def string_encoding(b: bytes): """ 獲取字符編碼類型/n :param b: 字節數據/n :return: /n """ # 遍歷編碼類型 for code in CODES:  try:   b.decode(encoding=code)   if 'UTF-8' == code and b.startswith(UTF_8_BOM):    return 'UTF-8-SIG'   return code  except Exception:   continue return '未知的字符編碼類型'

說明:file_encoding方法用于判斷文件編碼類型,參數為文件路徑;string_encoding方法用于判斷字符串編碼類型,參數為字符串對應的字節數據

使用示例:

import codingfile_name = input('請輸入待識別文件路徑:/n')encoding = coding.file_encoding(file_name)print(encoding)

以上這篇Python判斷文件和字符串編碼類型的實例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 响水县| 黑河市| 金塔县| 射阳县| 宁国市| 丹阳市| 兰州市| 邓州市| 肇东市| 张家口市| 无极县| 泗阳县| 石家庄市| 隆林| 台江县| 漯河市| 满城县| 晋中市| 南江县| 本溪市| 砚山县| 东丰县| 榆林市| 大竹县| 山东| 法库县| 巍山| 砀山县| 佛教| 闵行区| 马鞍山市| 鸡东县| 天津市| 加查县| 邵东县| 平凉市| 海宁市| 大英县| 大英县| 咸宁市| 邓州市|