語音數據處理

基本信息

MP4全稱為MPEG-4，是一種集音頻、視頻、收音機等於一體的多功能播放器，是嵌入式系統在消費電子領域的典型發展，語音信號是類似MP4嵌入式系統中常見的一種信號，其特徵是典型的基於時間軸上的一維數位訊號，MP4通過數位訊號處理器DSP來完成處理傳輸和解碼MP4檔案的任務。其中主要利用數位訊號處理算法對模擬信號數位化後的數據進行處理是決定系統性能的一個關鍵問題。高質量低速率的語音編碼技術是其中最主要的要求，它將模擬語音信號變成數位訊號以便在信道中傳輸。除了通信頻寬的要求外，嵌入式系統存儲容量的限制也要求對語音進行壓縮，以滿足巨量數據情況下進行實時或準實時微處理器處理的目的。

國內外在語音處理領域的研究焦點集中在兩個方面：

（1）在保證語音質量的前提下，降低數據率，該方法由於數據量的下降對保證語音質量不利；

（2）對傳統的語音編碼器進行全頻帶擴展，使其適應音頻的套用，但是該方法擴展頻寬必然造成數位化後數據量的增加，也不利於滿足嵌入式實時處理的要求。

處理過程

在通話過程中，跟用戶最直接打交道的是說和聽，所以語音數據處理的好壞直接影響了系統實現的成敗。語音數據處理的整個過程可以分為兩個部分：

A/D轉換

A/D轉換，即把原始聲音的模擬輸入轉化為數位化信息。

D/A轉換

D/A轉換，即把數字信息轉化為模擬數據。

編解碼

採用的AMR語音編碼支持4.65~12.2Kb/s的8種編碼速率，其算法複雜度較高，程式代碼量較大，結構較為複雜。

編碼流程

3GPP TS26.104 V6.1.0（Release6）ANSI-C原始碼中編碼主程式為coder.c，該程式的執行流程為：

（1）處理命令提示符；

（2）打開模式控制檔案；

（3）打開語音輸入檔案及編碼輸出檔案；

（4）初始化編碼器；

（5）以幀為單位壓縮語音；

（6）將編碼後的比特流寫入編碼輸出檔案；

（7）釋放編碼器。

解碼流程

原始碼中解碼主程式為decoder.c，該程式的執行流程為：

（1）處理命令提示符；

（2）打開解碼輸入及輸出檔案；

（3）初始化解碼器；

（4）以幀為單位解碼語音將合成語音數據寫入解碼輸出檔案；

語音數據處理

基本介紹

基本信息

處理過程

編解碼

編碼流程

解碼流程

數據處理

相關詞條

熱門詞條