python——代碼編碼格式轉(zhuǎn)換

2019-11-14 17:19:27

字體：大中小

供稿：網(wǎng)友

　　最近剛換工作不久，沒(méi)太多的時(shí)間去整理工作中的東西，大部分時(shí)間都在用來(lái)熟悉新公司的業(yè)務(wù)，熟悉他們的代碼框架了，最主要的是還有很多新東西要學(xué)，我之前主要是做php后臺(tái)開(kāi)發(fā)的，來(lái)這邊之后還要把我半路出家的前端學(xué)好、還要學(xué)習(xí)C++，哈哈，總之很充實(shí)了，每天下班回家都可以睡的很香（一句話總結(jié)，就是吃得香、睡的香~）。再說(shuō)說(shuō)換工作時(shí)候吧，今年年初正式畢業(yè)半年了，感覺(jué)自己技術(shù)增長(zhǎng)很快，原公司里面程序員的地位還不如運(yùn)營(yíng)，所以想換個(gè)工作，面試了3家（2家大的、一家小的），都給offer了，當(dāng)然從大公司里面挑了個(gè)各方面綜合（工資、干什么、交通等等）還不錯(cuò)的，反正感覺(jué)就很順利的進(jìn)來(lái)了（比畢業(yè)的時(shí)候容易多了），哈哈，越努力、越幸運(yùn)，越幸運(yùn)、越努力！。從這周開(kāi)始，繼續(xù)整理博客，免得給自己造成懶得習(xí)慣。

　　剛來(lái)這個(gè)公司，熟悉了環(huán)境，老大就開(kāi)始讓我做一個(gè)遷移、修改代碼的工作，我想說(shuō)的是，這種工作真沒(méi)勁~~，看別人的代碼、改別人的代碼、這里改個(gè)變量、那里改個(gè)文件名······，都是些沒(méi)技術(shù)含量、很繁瑣的事情，不過(guò)通過(guò)遷移代碼順便熟悉下環(huán)境也好。扯了這么多，說(shuō)說(shuō)今天的主題吧——代碼編碼格式改變，由于某些原因，需要將代碼從A機(jī)房遷移到B機(jī)房，這兩個(gè)之間不能互相訪問(wèn)，但是歷史原因?qū)е翧機(jī)房的代碼全是utf8編碼的，B機(jī)房要求是GBK編碼，看看這個(gè)怎么解決。

編碼問(wèn)題

　　先說(shuō)說(shuō)為什么會(huì)有編碼問(wèn)題，就拿上面那個(gè)例子來(lái)說(shuō)，B機(jī)房這邊數(shù)據(jù)庫(kù)全是GBK編碼的，因此從數(shù)據(jù)庫(kù)中取出來(lái)的數(shù)據(jù)都是GBK的，從數(shù)據(jù)庫(kù)中取出來(lái)的數(shù)據(jù)是GBK編碼的，要在展示的時(shí)候不亂碼，在不對(duì)數(shù)據(jù)庫(kù)取出的數(shù)據(jù)轉(zhuǎn)換的情況下，就需要發(fā)送header的時(shí)候設(shè)置編碼為GBK，輸出的文件（html、tpl等）都必須是GBK的，看看下面這個(gè)圖會(huì)更清楚點(diǎn)：

　　　　DB（GBK） => php等（編碼格式不限但如果代碼文件中有漢字，文件就要是gbk編碼或者在漢字輸出的時(shí)候轉(zhuǎn)化為gbk） => header(GBK) => html、tpl（GBK）

　　或者還有一種方式只在出庫(kù)的時(shí)候在代碼中將utf8轉(zhuǎn)化為gbk，總的來(lái)說(shuō)utf8還是更流行點(diǎn)，問(wèn)題更少點(diǎn)

　　　　DB(GBK) => php等(utf8，并將從數(shù)據(jù)庫(kù)取出的數(shù)據(jù)轉(zhuǎn)化為utf8) => header(utf8) => html、tpl(utf8)

　　只要按照上面這兩種規(guī)范編碼格式，就不會(huì)出現(xiàn)亂碼情況，起碼我測(cè)試的第一種方式是沒(méi)問(wèn)題的，所以我猜第二種也ok，好了，現(xiàn)在就來(lái)寫(xiě)一個(gè)轉(zhuǎn)換文件編碼格式的小腳本：

#!/usr/bin/python# -*- coding: utf-8 -*-#Filename:changeEncode.pyimport osimport sysdef ChangeEncode(file,fromEncode,toEncode):    try:        f=open(file)        s=f.read()        f.close()        u=s.decode(fromEncode)        s=u.encode(toEncode)        f=open(file,"w");        f.write(s)        return 0;    except:        return -1;def Do(dirname,fromEncode,toEncode):    for root,dirs,files in os.walk(dirname):        for _file in files:            _file=os.path.join(root,_file)            if(ChangeEncode(_file,fromEncode,toEncode)!=0):                PRint "[轉(zhuǎn)換失敗:]"+_file            else:                print "[成功：]"+_filedef CheckParam(dirname,fromEncode,toEncode):    encode=["UTF-8","GBK","gbk","utf-8"]    if(not fromEncode in encode or not toEncode in encode):        return 2    if(fromEncode==toEncode):        return 3    if(not os.path.isdir(dirname)):        return 1    return 0        if __name__=="__main__":    error={1:"第一個(gè)參數(shù)不是一個(gè)有效的文件夾",3:"源編碼和目標(biāo)編碼相同",2:"您要轉(zhuǎn)化的編碼不再范圍之內(nèi)：UTF-8，GBK"}    dirname=sys.argv[1]    fromEncode=sys.argv[2]    toEncode=sys.argv[3]    ret=CheckParam(dirname,fromEncode,toEncode)    if(ret!=0):        print error[ret]    else:        Do(dirname,fromEncode,toEncode)