物理描述
語言在傳輸過程中,混響、失真、噪聲(信噪比)等因素都會導致音位的包絡函式發生變化。從而導致語言可懂度惡化。研究 m(或調製指數)的變化,即可確定語言可懂度惡化的程度。
連續的語言信號可以認為是一系列被稱為“音位 phoneme”的語音碎片組成的。而“音位”又可以認為是一個窄帶噪聲被發音器官的極低頻運動所調製而形成,在時域上表現為一個以某種窄帶噪聲為載波的調幅波。因而,每一個音位都有自己的包絡函式,語言所傳遞信息就包含在該調幅波包絡之中。下圖示一個音位的包絡及其包絡的頻譜。包絡頻率F 約在 0.2~12.5Hz 之間。頻譜的相對量值是用調製指數表示的,m 是各調製分量對載波的調幅度。
一般用語言傳輸指數 STI (speech transmission index)來描述語言清晰度的好壞。
測量方法
傳統方法
按照相關標準,由發音人發出語言單位(句、詞或音節),經語言傳遞系統,考察聽音人正確識別的比率。
具體的操作步驟需按照標準 PB-words, CVC 或 SRT。儘管這種方法可以測得語言清晰度,但是要進行這樣的測量需花費很長時間並且花費巨大,並且在一些對人體有害的位置這種方法也不可行。因此,這些方法主要用來驗證候補的測量方法。
科學方法
回溯到 1940 年,貝爾實驗室開始研究確定語言清晰度的量測技術。那些很成熟的算法,比如 SII(語言清晰度指數)和各種形式的 STI(語言傳遞指數)都是可以很好的量測語言清晰度。這些測量方法考慮了很多對語言清晰度有影響參量,比如:
語言聲壓級
背景噪聲聲壓級
反射
混響時間
心裡聲學效果(掩蔽效應)
STI 法
STI 法,即“語言傳輸指數 “speech transmission index” 法。
該法用人工合成的測量信號進行測量。其信號在模擬一個“音位”的基礎上,考慮到以下諸因素:平均
語聲譜、頻率計權、聽覺掩蔽效應、聽覺門檻、由非線性和非線性互調引起的諧波分量(正確的設計可以使這些分量變成干擾測試信號的噪聲而不是無法從當前測試信號中分離的諧波)等
STI 信號包含 7 個窄帶噪聲載波,其中心頻率為
125Hz、250Hz、500Hz、1kHz、2kHz、4kHz、8kHz
每一個載波分別用14個極低頻的簡諧信號調製,調製信號的頻率為:
0.63\0.80\1.0\1.25\1.6\2.0\2.5\3.15\4.0\5.0\6.3\8.0\10\12.5(單位為 Hz, 相隔 1/3 倍頻程)
共有 98 個測量信號分量。
STIPA 法
由 STI 法派生出 3 種簡縮版 (condenced version):
STITEL - 適用於長途通信 (STI for telecommunication systems);
RASTI - 適用於不用電聲設備的、僅由房間聲學特性決定的可懂度測量 (room acoustics STI);
STIPA - 適用於擴聲系統(STI for pubblic address systems)。即適用於評價包括擴聲系統和房間聲學特性的語言傳輸質量。
與 STI 法不同的是,STIPA 法把測量信號矩陣簡化了。主要是只選用 12 個調製頻率,且每個載波只有 2 個調製頻率,其構成如下:
載波中心頻率 Hz | 125-250 | 500 | 1k | 2k | 4k | 8k |
第一調製頻率 Hz | 1 | 0.63 | 2 | 1.25 | 0.8 | 2.5 |
第二調製頻率 Hz | 5 | 3.15 | 10 | 6.25 | 4 | 12.5 |
這樣,98個測量信號便縮減為14個。
STIPA 是在廣泛的科學研究下得到的標準化的結果。但與 RASTI 不同的是,在 2 年內已經有 4 家國際測試儀器製造商採用了 STIPA 的方法並提供了解決方案。由於其精確的測試結果和較短的量測時間(15s),可以這樣說 STIPA 是世界上測量語言清晰度套用最廣泛的方法。
套用案例
語言清晰度對信息傳遞極其重要。
例如:建築群中的公共廣播系統必須具有在緊急情況下指導人群逃生方向的能力。這些建築群包括機場,火車站,購物中心或者音樂廳等。儘管如此,如果由於廣播系統質量差而導致人群不能聽清楚播放的通知,而不能安全逃離,由此導致的後果可能非常悲慘。因此設計,安裝並且驗證公共廣播系統的語言清晰度是必不可少的。此外,還有很多其他套用(比如法律和醫療方面),也會套用到語言清晰度為其提供佐證。