主要內容
頻譜是許多不同
頻率的集合,形成一個很寬的頻率範圍;且不同的
頻率其
振幅可能不同。將不同
頻率的
振幅最高點連結起來形成的曲線,就叫頻譜包絡線。在調頻信號中,一個高頻信號,它幅度是按調製
信號變化的。如果把高頻調幅信號的峰點連線起來,就可以得到一個與低頻調製信號相對應的曲線。這條曲線就是包絡線。
且有一點是值得注意的。只有
周期信號的頻譜有包絡線,這是因為
周期信號的頻譜是離散的,而非周期信號沒有包絡線,這是因為非周期信號的頻譜是連續的。
主要類別
語音頻譜包絡
語音頻譜包絡,即spectrum-envelope of voice。
語音是一個複雜的多頻信號,各個頻率成分具有不同的幅度。將它們按
頻率的大小加以排列時,其頂端所練成的曲線,成為語音頻譜包絡。
包絡線的形狀是隨所發的聲音而變化的。聲帶振動產生的聲波通過由口腔、鼻腔等構成的聲道時將產生
共振。共振的結果會使頻譜的某些區域得到加強。因此,頻譜包絡線的形狀因人而異。但一般說來,它具有若干個峰和谷。其中,前三個
共振峰包含語言的大部分信息,它們的頻率和幅度隨所發的聲音而變化。
語音頻譜包絡與語音信號的語義信息和個性信息都密切相關。提取語音頻譜包絡即是從語音頻譜中分離出諧振包絡曲線,即聲道系統
傳遞函式。該聲道系統傳遞函式可通過通過倒譜係數、
共振峰頻率或者
LPC係數等參數進行表示,這些參數在
語音編碼、
語音識別、語音轉換和
語音合成等領域都有重要的作用。
頻譜包絡濾波器
近年來,在
圖像處理領域,建立了一種形似頻譜包絡的濾波器,被稱為頻譜包絡
濾波器。其在圖像的每一點的取值都對應了圖像頻譜的修正參數。取值較大的區域對應圖像頻譜的對應圖像頻譜中需要保留的對重構圖像有重要作用的能量聚集區;取值較小的區域對應圖像頻譜中的需要抑制的背景
噪聲區,通過頻譜包絡濾波器修正的圖像頻譜,基本保留了原始
頻譜的圖像特徵,在較好的保護了圖像的能量聚集區的同時,抑制了背景噪聲的
頻率分量,使得濾波後的圖像獲得了保邊與
平滑的較好結合。
提取方法
時域提取方法
時域提取方法主要是通過線性預測對
信號進行解卷積。線性預測分析建立了一個很好的頻率產生模型,其重要性在於它能夠高效的估計參數,用較少的
LPC係數就可以較好的表現
波形及其
頻譜性質,通過LPC係數可以較準確的表示聲道
系統函式。由於線性預測方法是建立在有限階的全極點模型的基礎上,當語音表現為清音、濁音或者過渡音時,特別對某些含零點的聲道系統模型來說,這種方法分離的結果不準確。通過線性預測計算共振峰參數時一般採用
多項式求根法。
頻域提取方法
頻域提取方法主要是通過同態處理對
語音信號進行解卷積。對語音信號進行同態處理後將得到倒譜係數,聲道衝擊回響和聲門激勵信號被轉換成了相加的關係。同態濾波後,聲門激勵和聲道回響被分離開來。倒譜係數的高時域部分攜帶了激勵信息,而低時域部分攜帶了聲道信息。通過倒譜係數可以計算語音的基音周期,也可以表示語音的聲道系統函式。常見的倒譜係數有LPCC倒譜、
DFT倒譜以及
MFCC倒譜係數。對比倒譜係數表示方法與時域方法
LPC係數表示方法,由於它們是對同一幀語音序列提取聲道系統函式的兩種不同的方法,表示的頻譜包絡應該相似,只是準確程度不同,在某些情況下它們還可以相互轉換。LPCC倒譜,是通過假設時域表示方法與頻域表示方法的結果相同,從
LPC係數直接導出倒譜係數的計算方法。
倒譜係數一般用於
語音識別領域。倒譜法估計
共振峰參數的效果較好,但涉及到頻率求模、複數變換、取對數運算以及離散
傅立葉變換的正反變換運算,計算量太大,並且容易受噪聲的影響。
子帶劃分提取方法
這種方法也稱為帶通濾波器組法,濾波器組的中心頻率可以等間隔的分布在分析頻段上也可以非均勻的分布。設計
濾波器組,
濾波器輸出用於提供頻譜包絡估值。對給定頻率範圍內的峰值進行判別可得到共振峰值。 ’
在
語音編碼算法中,子帶編碼算法(SBC,Sub—Band Coding)就是在
頻率域中對語音譜進行分割,然後進行
數據壓縮的方法。在子帶編碼中,首先用一組帶通
濾波器,將輸入信號分成若干個在不同頻段上的子帶信號,對子帶信號分別提取包絡參數和激勵信號,然後進行
量化、
編碼。子帶劃分的方法能很好的匹配語音信號的非線性和非平穩性,但還需要在子帶分割濾波器組設計和子帶參數提取算法進行改進。例如,在高質量音頻
編碼算法MPEG4.AACl261中採用MDCT算法進行
濾波運算,實現語音譜的分割。