maketrans和translate函數(shù)是進行字符串字符編碼的常用方法。本文著重點在于演示其基本用法和在不同版本下操作的差異。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。
2.X版本把字符串基本分為兩種:unicode字符串和8位字符串str,后者包含字節(jié)數(shù)據(jù)和我們常見的ASCII碼數(shù)據(jù);而3.X版本則重新對字符串進行了劃分,分為了字節(jié)字符串bytes和文本字符串str,兩者都是不可變的,所以添加了一個可變的字節(jié)字符串類型bytearray。
2.X版本中string類型和str、unicode類型大量方法是重復的,所以3.X版本不提倡使用string模塊中與str重復的方法。string模塊中還有很多有用的常量和方法,比如string.digits,可以在字符串編碼中方便地使用。
2.X中maketrans和translate函數(shù)的簽名:
string.maketrans(from, to) string.translate(s, table[, deletechars]) str.translate(table[, deletechars]) unicode.translate(table)
3.X中maketrans和translate函數(shù)的簽名:
static str.maketrans(x[, y[, z]]) static bytes.maketrans(from, to) static bytearray.maketrans(from, to) str.translate(map) bytes.translate(table[, delete]) bytearray.translate(table[, delete])
從中可以看出,相對于2.X的string模塊的maketrans方法,3.X中分別提供了三個靜態(tài)方法用于創(chuàng)建映射表。
下面讓我們看一個簡單的例子來說明字符串轉換的過程:
2.X下的演示過程:
>>> import string #導入string模塊 >>> map = string.maketrans('123', 'abc') #建立映射表,將字符串中含有的'1','2','3'替換為'a','b','c' >>> s = '54321123789' #轉換前的字符串 >>> s.translate(map) #用創(chuàng)建的映射表map轉換字符串 '54cbaabc789' #轉換后的字符串
3.X下的演示過程:
>>> map = str.maketrans('123','abc') >>> s = '54321123789' >>> s.translate(map) '54cbaabc789'
2.X使用了string的maketrans函數(shù),而3.X使用了str的maketrans函數(shù),除了這一點,使用方法是基本相同的。若指定字符串中要刪除的字符時,使用就會略有不同,如下:
2.X下的演示過程:
>>> import string >>> map = string.maketrans('123', 'abc') >>> s = '54321123789' >>> s.translate(map, '78') #除了轉換,還要刪除字符串中的字符'7','8' '54cbaabc9' #轉換后的字符串沒有字符'7','8'
3.X下的演示過程:
新聞熱點
疑難解答