3. 迭代器
3.1. 迭代器(Iterator)概述
迭代器是訪問集合內(nèi)元素的一種方式。迭代器對象從集合的第一個元素開始訪問,直到所有的元素都被訪問一遍后結(jié)束。
迭代器不能回退,只能往前進(jìn)行迭代。這并不是什么很大的缺點,因為人們幾乎不需要在迭代途中進(jìn)行回退操作。
迭代器也不是線程安全的,在多線程環(huán)境中對可變集合使用迭代器是一個危險的操作。但如果小心謹(jǐn)慎,或者干脆貫徹函數(shù)式思想堅持使用不可變的集合,那這也不是什么大問題。
對于原生支持隨機訪問的數(shù)據(jù)結(jié)構(gòu)(如tuple、list),迭代器和經(jīng)典for循環(huán)的索引訪問相比并無優(yōu)勢,反而丟失了索引值(可以使用內(nèi)建函數(shù)enumerate()找回這個索引值,這是后話)。但對于無法隨機訪問的數(shù)據(jù)結(jié)構(gòu)(比如set)而言,迭代器是唯一的訪問元素的方式。
迭代器的另一個優(yōu)點就是它不要求你事先準(zhǔn)備好整個迭代過程中所有的元素。迭代器僅僅在迭代至某個元素時才計算該元素,而在這之前或之后,元素可以不存在或者被銷毀。這個特點使得它特別適合用于遍歷一些巨大的或是無限的集合,比如幾個G的文件,或是斐波那契數(shù)列等等。這個特點被稱為延遲計算或惰性求值(Lazy evaluation)。
迭代器更大的功勞是提供了一個統(tǒng)一的訪問集合的接口。只要是實現(xiàn)了__iter__()方法的對象,就可以使用迭代器進(jìn)行訪問。
3.2. 使用迭代器
使用內(nèi)建的工廠函數(shù)iter(iterable)可以獲取迭代器對象:
代碼如下:
>>> lst = range(2)
>>> it = iter(lst)
>>> it
<listiterator object at 0x00BB62F0>
使用迭代器的next()方法可以訪問下一個元素:
代碼如下:
>>> it.next()
0
如果是Python 2.6+,還有內(nèi)建函數(shù)next(iterator)可以完成這一功能:
代碼如下:
>>> next(it)
1
如何判斷迭代器還有更多的元素可以訪問呢?Python里的迭代器并沒有提供類似has_next()這樣的方法。
那么在這個例子中,我們已經(jīng)訪問到了最后一個元素1,再使用next()方法會怎樣呢?
代碼如下:
>>> it.next()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration
Python遇到這樣的情況時將會拋出StopIteration異常。事實上,Python正是根據(jù)是否檢查到這個異常來決定是否停止迭代的。
這種做法與迭代前手動檢查是否越界相比各有優(yōu)點。但Python的做法總有一些利用異常進(jìn)行流程控制的嫌疑。
了解了這些情況以后,我們就能使用迭代器進(jìn)行遍歷了。
代碼如下:
it = iter(lst)
try:
while True:
新聞熱點
疑難解答
圖片精選