言語識別系統

言語識別系統(speechcogmtion system)是識別人的言語的計算機系統。計算機用算法識別言語的一般過程:(1)用濾波器組件分析、傅立葉分析、線性預測編碼等技術將人的語音從模擬量轉化為數字表達式;(2)將由此產生的數據規格化,以控制不同的語速、振幅和輸入語音物理背景(如噪聲);(3)從數字表達式中提取可區別不同語音的聲學特徵,如共振峰,用戶語音的數學表達式和與它相聯繫的聲學特徵,提供一個數據模式;(4)將數據模式與存貯在識別系統中的語音樣板進行比較;(5)系統決定為用戶語音選中某個匹配樣板或拒絕識別。

根據對說話人的依存性,可分為依存說話人識別系統和不依存說話人識別系統。前者只有在得到用戶個人的言語樣本後,才能識別他的言語;後者在理論上能識別使用某種語言的任何人所說的話。實際上它的識別準確性取決於用戶群體言語特徵的相似性。相似性越大,識別準確性越高。根據說話方式,可分成孤立詞識別系統、連線詞識別系統和連續詞識別系統。用戶向孤立詞識別系統說話時,必須在各個詞項之間作短暫的停頓。這種系統的識別準確性最高。連線詞識別系統能識別詞與詞之間投有人為停頓的言語,但是用戶讀個別詞要用允許的同樣的聲調模式。連續詞識別系統能識別自然言語。這種系統正在研製發展中。根據所用詞表大小,可分為固定詞表識別系統和無限詞表識別系統。無限詞表的算法還在研製中,需要將言語分成音素段,然後確定所說的詞,進而組成文本。不管哪一種系統,均碰到人的言語可變性問題。這種可變性不僅表現在不同國家的語言差異上,還反映在同種言語的方言差異、個人語型差異以及由生理、心理或環境因素引起的個人語型在時間上的變化等。這些因素將影響識別績效。如在應激條件下人的語調變化時,系統會拒絕識別。

相關詞條

熱門詞條

聯絡我們