庫利－圖基快速傅立葉變換算法:簡介,複雜度,時域-頻域抽取法,時域抽取法,頻域抽取

庫利－圖基快速傅立葉變換算法（Cooley-Tukey算法）是最常見的快速傅立葉變換算法。這一方法以分治法為策略遞歸地將長度為N = N1N2的DFT分解為長度分別為N1和N2的兩個較短序列的DFT，以及與旋轉因子的複數乘法。

基本介紹

中文名：庫利－圖基快速傅立葉變換算法
外文名：Cooley-Tukey

簡介,複雜度,時域-頻域抽取法,時域抽取法,頻域抽取法,單一基底,2基底,4基底,8基底,混合基底,2-8基底,2-4-8基底,4基底,8基底,

簡介

這種方法以及FFT的基本思路在1965年J. W. Cooley和J. W. Tukey合作發表An algorithm for the machine calculation of complex Fourier series之後開始為人所知。但後來發現，實際上這兩位作者只是重新發明了高斯在1805年就已經提出的算法（此算法在歷史上數次以各種形式被再次提出）。

庫利－圖基快速傅立葉變換算法是將序列長為N的DFT分區為兩個長為N/2的子序列的DFT，因此這一套用只適用於序列長度為2的冪的DFT計算，即基2-FFT。實際上，如同高斯和庫利與圖基都指出的那樣，庫利－圖基算法也可以用於序列長度N為任意因數分解形式的DFT，即混合基FFT，而且還可以套用於其他諸如分裂基FFT等變種。儘管庫利－圖基算法的基本思路是採用遞歸的方法進行計算，大多數傳統的算法實現都將顯示的遞歸算法改寫為非遞歸的形式。另外，因為庫利－圖基算法是將DFT分解為較小長度的多個DFT，因此它可以同任一種其他的DFT算法聯合使用。

複雜度

離散傅立葉變換的複雜度為

（可引用大O符號）。快速傅立葉變換的複雜度為

，分析可見下方架構圖部分，級數為

而每一級的複雜度為

，故複雜度為

。

時域-頻域抽取法

在FFT算法中，針對輸入做不同方式的分組會造成輸出順序上的不同。如果我們使用時域抽取（Decimation-in-time），那么輸入的順序將會是比特反轉排列（bit-reversed order），輸出將會依序排列。但若我們採取的是頻域抽取（Decimation-in-frequency），那么輸出與輸出順序的情況將會完全相反，變為依序排列的輸入與比特反轉排列的輸出。

時域抽取法

我們可以將DFT公式中的項目在時域上重新分組，這樣就叫做時域抽取（Decimation-in-time），在這裡

將會被代換為旋轉因子（twiddle factor）

。

在這邊我們要注意的是，我們所替換的G[k]與H[k]具有周期性：

上述的推導可以劃成下面的圖：

劃紅框處所示的

點DFT架構如下圖所示：

劃紅框處所示的

點DFT架構如下圖所示：

下圖是一個8點DIT FFT的完整架構圖。

頻域抽取法

我們可以將DFT公式中的項目在頻域上重新分組，這樣就叫做頻域抽取（Decimation-in-frequency）。

首先先觀察在頻域上偶數項的部分：

再觀察在頻域上奇數項的部分：

上述的推導可以畫成下面的圖：

更進一步的拆解

-point DFT的架構

下圖為8點FFT下

-point DFT的架構

總結上述架構，完整的8點DIF FFT架構圖為

單一基底

利用庫利－圖基算法進行離散傅立葉拆解時，能夠依需求而以2, 4, 8…等2的冪次方為單位進行拆解，不同的拆解方法會產生不同層數快速傅立葉變換的架構，基底越大則層數越少，複數乘法器也越少，但是每級的蝴蝶形架構則會越複雜，因此常見的架構為2基底、4基底與8基底這三種設計。

2基底

2基底-快速傅立葉算法（Radix-2 FFT）是最廣為人知的一種庫利－圖基快速傅立葉算法分支。此方法不斷地將N點的FFT拆解成兩個'N/2'點的FFT，利用旋轉因子

的對稱性藉此來降低DFT的計算複雜度，達到加速的功效。

而其實前述有關時域抽取或是頻域抽取的方法介紹，即為2基底的快速傅立葉轉換法。以下展示其他種2基底快速傅立葉算法的連線方法，此種不規則的連線方法可以讓輸出與輸入都為循序排列，但是連線的複雜度卻大大的增加。

4基底

4基底快速傅立葉變換算法則是承接2基底的概念，在此里用時域抽取的技巧，將原本的DFT公式拆解為四個一組的形式：

在這裡再利用

的特性來進行與2基數FFT類似的化減方法，以降低算法複雜度。

8基底

在庫利－圖基算法裡，使用的基底（radix）越大，複數的乘法與存儲器的訪問就越少，所帶來的好處不言而喻。但是隨之而來的就是實數的乘法與實數的加法也會增加，尤其計算單元的設計也就越複雜，對於可套用FFT之點數限制也就越嚴格。在表中我們可以看到在不同基底下所需的計算成本。

動作	2基底	4基底	8基底
複數乘法	22528	15360	10752
實數乘法	0	0	8192
複數加法	49152	49152	49152
實數加法	0	0	8192
存儲器訪問	49152	24576	16384

在DFT的公式中，我們重新定義x=[x(0),x(1),…,x(N-1)]T, X=[X(0),X(1),…,X(N-1)]T，則DFT可重寫為X=FN‧x。FN是一個N×N的DFT矩陣，其元素定義為[FN]ij=WNij(i,j ∈ [0,N-1])，當N=8時，我們可以得到以下的F8矩陣並且進一步將其拆解。

在拆解成三個矩陣相乘之後，我們可以將複數運算的數量從56個降至24個複數的加法。底下是8基底的的SFG。要注意的是所有的輸出與輸入都是複數的形式，而輸出與輸入的排序也並非規律排列，此種排列方式是為了要達到接線的最最佳化。

混合基底

2-8基底

在2/8基底的算法中，我們可以看到我們對於偶數項的輸出會使用2基底的分解法，對於奇數項的輸出採用8基底的分解法。這個做法充分利用了2基底與4基底擁有最少乘法數與加法數的特性。當使用了2基底的分解法後，偶數項的輸出如下所示。

奇數項的輸出則交由8基底分解來處理，如下四式所述。

以上式子就是2/8基底的FFT快速算法。在架構圖上可化為L型的蝴蝶運算架構，如下圖所示。

2-4-8基底

為了改進Radix 2/8在架構上的不規則性，我們在這裡做了一些修改，如下表.。此修改可讓架構更加規則，且所使用的加法器與乘法器數量更加減少，如下表所示。

N=8	2基底	4基底	2/4混合基底	2/4/8基底
8	2	-	2	0
64	98	76	72	48
512	1538	-	1082	824
4096	18434	13996	12774	10168

在這裡我們最小的運算單元稱為PE（Process Element）,PE內部包含了2/8基底、2/4基底、2基底的運算，簡化過的信號處理流程與蝴蝶型架構圖可見下圖

4基底

基底的選擇越大會造成蝴蝶形架構更加複雜，控制電路也會複雜化。因此Shousheng He和Mats Torkelson在1996提出了一個2^2基底的FFT算法，利用旋轉因子的特性：

。而–j的乘法基本上只需要將被乘數的實部虛部對調，然後將虛部加上負號即可，這樣的負數乘法被定義為'簡單乘法'，因此可以用很簡單的硬體架構來實現。利用上面的特性，22基底FFT能用串接的方式將旋轉因子以4為單位對DFT公式進行拆解，將蝴蝶形架構層數降到log4N，大幅減少複數乘法器的用量，而同時卻維持了2基底蝴蝶形架構的簡單性，在性能上獲得改進。2^2基底DIF FFT算法的拆解方法如下列公式所述：