GSM系統的語音編碼標準RPE-LTP

一種使用激勵幀中固定間隔脈衝的語言編碼,長期預報器用於建立精細結構模型(音調)。

基本介紹

  • 中文名:規則脈衝激勵長期預測
  • 外文名:regularpulseexcitation-longtermprediction
  • 縮寫:RPE-LTP
背景,概念,特點,性能,

背景

近幾十年來,語音編碼技術發展非常迅速。高速發展的DSP技術為語音信號處理提供了強有力的工具,使得實時實現各種各樣的複雜算法成為可能。針對不同的套用,國際標準組織制定了一系列的語音壓縮編碼標準。其中,RPE-LTP語音編碼算法是由英國、芬蘭、原西德、法國、義大利、荷蘭、挪威及瑞典等國組成的語音編碼專家小組從最初提交的20多種語音編碼方案中優選6種進行了測試,最後以MPE-LTP和RPE-LTP兩種為藍本,制定的碼速率為13kbit/s的、帶有長時預測環節的規則脈衝激勵線性預測編碼器。隨著超大規模積體電路技術上取得的突破進展,集成化的DSP數位訊號處理器具有體積小、功耗低和運算速度快等諸多優點,因此非常適用於語音信號的壓縮處理。目前的DSP晶片以其強大的數據處理功能而在通信和其他信號處理領域得到廣泛注意,並己成為開發套用的熱點技術。

概念

GSM的語音訊號處理也是屬於模型式欴壓縮方法,也就是說,將人的聲音模型化為一個氣流激發源流過氣管與嘴型變化後的變化,這種方法和CD壓縮音樂方式是不同的。由於這種方法是專門針對語音信息,所以能夠提供高壓縮比但仍能得到可理解的語音訊號。當然,因為GSM已經算是蠻舊的技術了(雖然國內的市場才剛起飛),所以GSM中的RPE-LTP(RegularPulseExcitation-LongTermPrediction)其實壓縮率只是還好而已。利用這種技術,語音數據可以壓縮到13Kbps,約有十倍左右。壓縮過程中包含了一些類似濾波的過程,再加上向量量化(VectorQuantization)中的字典搜尋步驟。基本上,所有的編碼方式中,解碼的過程通常都比編碼要簡單地多,但對手機來說,除了要收聽對方說的話之外,也得傳送自己講的話,所以語音的編解碼都得做在手機之中。

特點

抽樣速率為8kHz。
幀長為20ms,160個樣點。每幀分為4子幀,每子幀長5ms,40個樣點。
每幀編碼後為260bit。即純比特率為13kbit/s。
編碼後的語音比特分為兩類。第一類含182bit,它們對誤碼是敏感的,即這些比特中發生差錯會對語音質量產生嚴重影響。第二類含78bit,它們的出錯對接收語音的質量敏感度較低,不受保護。
分配給編解碼器的最大時延為30ms。端對端的最大時延在70ms左右,其中40多毫秒分配給時隙交織和信道編解碼。
為了實現語音的間斷傳輸,可套用話音激活檢測器。
每個用戶的語音總比特率為270.833(kbit/s)/8=33.85kbit/s,具體分配如下:
語音編解碼為13.0kbit/s。
語音的差錯保護為9.8kbit/s。
慢速隨路控制信道SACCH占0.95kbit/s。
保護時間、同步和均衡等為l0.lkbit/s(約占總速率的30%)。

性能

對RPE-LTP編解碼器實測結果為:在較好接收信噪比條件下,RPE-LTP編解碼器的話音質量(MOS)為4,時延為22.65~28ms。

相關詞條

熱門詞條

聯絡我們