Python的內建模塊itertools提供了非常有用的用于操作迭代對象的函數。
首先,我們看看itertools提供的幾個“無限”迭代器:
>>> import itertools>>> natuals = itertools.count(1)>>> for n in natuals:... print n...123...
因為count()會創建一個無限的迭代器,所以上述代碼會打印出自然數序列,根本停不下來,只能按Ctrl+C退出。
cycle()會把傳入的一個序列無限重復下去:
>>> import itertools>>> cs = itertools.cycle('ABC') # 注意字符串也是序列的一種>>> for c in cs:... print c...'A''B''C''A''B''C'...同樣停不下來。
repeat()負責把一個元素無限重復下去,不過如果提供第二個參數就可以限定重復次數:
>>> ns = itertools.repeat('A', 10)>>> for n in ns:... print n...打印10次'A'
無限序列只有在for迭代時才會無限地迭代下去,如果只是創建了一個迭代對象,它不會事先把無限個元素生成出來,事實上也不可能在內存中創建無限多個元素。
無限序列雖然可以無限迭代下去,但是通常我們會通過takewhile()等函數根據條件判斷來截取出一個有限的序列:
>>> natuals = itertools.count(1)>>> ns = itertools.takewhile(lambda x: x <= 10, natuals)>>> for n in ns:... print n...
打印出1到10
itertools提供的幾個迭代器操作函數更加有用:
chain()
chain()可以把一組迭代對象串聯起來,形成一個更大的迭代器:
for c in chain('ABC', 'XYZ'): print c# 迭代效果:'A' 'B' 'C' 'X' 'Y' 'Z'groupby()
groupby()把迭代器中相鄰的重復元素挑出來放在一起:
>>> for key, group in itertools.groupby('AAABBBCCAAA'):... print key, list(group) # 為什么這里要用list()函數呢?...A ['A', 'A', 'A']B ['B', 'B', 'B']C ['C', 'C']A ['A', 'A', 'A']實際上挑選規則是通過函數完成的,只要作用于函數的兩個元素返回的值相等,這兩個元素就被認為是在一組的,而函數返回值作為組的key。如果我們要忽略大小寫分組,就可以讓元素'A'和'a'都返回相同的key:
>>> for key, group in itertools.groupby('AaaBBbcCAAa', lambda c: c.upper()):... print key, list(group)...A ['A', 'a', 'a']B ['B', 'B', 'b']C ['c', 'C']A ['A', 'A', 'a']imap()
imap()和map()的區別在于,imap()可以作用于無窮序列,并且,如果兩個序列的長度不一致,以短的那個為準。
>>> for x in itertools.imap(lambda x, y: x * y, [10, 20, 30], itertools.count(1)):... print x...104090
新聞熱點
疑難解答