解釋
生成器也是一種疊代器,但是你只能對其疊代一次。這是因為它們並沒有把所有的值存在
記憶體中,而是在運行時生成值。你通過遍歷來使用它們,要么用一個“for”循環,要么將它們傳遞給任意可以進行疊代的函式和結構。大多數時候生成器是以函式來實現的。然而,它們並不返回一個值,而是yield(暫且譯作“生出”)一個值。
生成器創造方法
通過列表生成式,我們可以直接創建一個列表。但是,受到記憶體限制,列表容量肯定是有限的。而且,創建一個包含100萬個元素的列表,不僅占用很大的存儲空間,如果我們僅僅需要訪問前面幾個元素,那後面絕大多數元素占用的空間都白白浪費了。
所以,如果列表元素可以按照某種算法推算出來,那我們是否可以在循環的過程中不斷推算出後續的元素呢?這樣就不必創建完整的list,從而節省大量的空間。在Python中,這種一邊循環一邊計算的機制,稱為生成器(Generator)。
要創建一個generator,有很多種方法。第一種方法很簡單,只要把一個列表生成式的[]改成(),就創建了一個generator:
>>> L = [x * x for x in range(10)]>>> L[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]>>> g = (x * x for x in range(10))>>> g<generator object <genexpr> at 0x104feab40>
創建L和g的區別僅在於最外層的[]和(),L是一個list,而g是一個generator。我們可以直接列印出list的每一個元素,但我們怎么列印出generator的每一個元素呢?
如果要一個一個列印出來,可以通過generator的next()方法:
>>> g.next()0>>> g.next()1>>> g.next()4>>> g.next()9>>> g.next()16>>> g.next()25>>> g.next()36>>> g.next()49>>> g.next()64>>> g.next()81>>> g.next()Traceback (most recent call last): File "<stdin>", line 1, in <module>StopIteration
我們講過,generator保存的是算法,每次調用next(),就計算出下一個元素的值,直到計算到最後一個元素,沒有更多的元素時,拋出StopIteration的錯誤。
當然,上面這種不斷調用next()方法實在是太變態了,正確的方法是使用for循環。
所以,我們創建了一個generator後,基本上永遠不會調用next()方法,而是通過for循環來疊代它。
generator非常強大。如果推算的算法比較複雜,用類似列表生成式的for循環無法實現的時候,還可以用函式來實現。比如,著名的斐波拉契數列(Fibonacci),除第一個和第二個數外,任意一個數都可由前兩個數相加得到:1, 1, 2, 3, 5, 8, 13, 21, 34, ...斐波拉契數列用列表生成式寫不出來,但是,用函式把它列印出來卻很容易。
仔細觀察,可以看出,fib函式實際上是定義了斐波拉契數列的推算規則,可以從第一個元素開始,推算出後續任意的元素,這種邏輯其實非常類似generator。
也就是說,上面的函式和generator僅一步之遙。要把fib函式變成generator,只需要把print b改為yield b就可以了:
def fib(max): n, a, b = 0, 0, 1 while n < max: yield b a, b = b, a + b n = n + 1
這就是定義generator的另一種方法。如果一個函式定義中包含yield關鍵字,那么這個函式就不再是一個普通函式,而是一個generator:
>>> fib(6)<generator object fib at 0x104feaaa0>
這裡,最難理解的就是generator和函式的執行流程不一樣。函式是順序執行,遇到return語句或者最後一行函式語句就返回。而變成generator的函式,在每次調用next()的時候執行,遇到yield語句返回,再次執行時從上次返回的yield語句處繼續執行。