語音合成晶片

產生背景

伴隨著各種家用電器設備，車載設備的功能增加，設備的操控性越來越複雜；人機互動設計在系統設計中的地位越來越重要。受到系統成本、體積等多方面的限制，套用開發人員可以選擇的人機互動設計方法並不多。利用語音合成晶片來增強人機互動性能的方法又重新開始受到套用開發人員的重視。

語音合成晶片的核心技術是語音數據壓縮。這項技術在二戰前就開始被研究，但其轉化為晶片並被實際產品採用卻是在70年代末。由於受到存儲器容量的限制，當時比較流行的是參數合成方式，這是一種模擬人體發聲器官，建立數學模型，並以此作為參數進行壓縮合成的方法。但是這種方法的實際使用效果並不能滿足人們的要求，最終在市場上受到認可的是基於ADPCM(Adaptive differential PCM)技術的語音壓縮合成方式。

OKI公司從70年代就從事ADPCM的研究開發工作，並不斷進行改進，相繼推出了具有更大壓縮率和更高音質的OKI ADPCM、OKI ADPCM2方式。OKI語音晶片完美的音質，優秀的性能得到了客戶的認可，25年的累計出貨量達到了4億個。 高音質語音合成晶片增強人機互動性能 在使用語音合成晶片時，最令套用開發人員頭痛的問題是如何在有限的存儲器當中，放入更多的語音數據。通常的做法是將播放內容中重複出現的地方進行切割，在需要利用的時候，對這些重複內容進行復用。雖然這個做法可以解決問題，但一般在使用當中，如果有大量需要復用的語音段出現時，將會使播放控制程式非常冗長。而且在不同的地方進行復用時，音調、語速等都會有微妙變化，這些變化如果不加以區分處理，就會在播放時造成不自然和失真。因此在播放不同內容時需要適當加入不同的延時。比如在實現圖1的播放內容時，一般需要程式寫成如下形式。 Play(Address1); Delay(xxx); Play(Address2); Delay(xxx); Play(Address4); Delay(xxx); Play(Address5); 這種實現方法無疑是對程式存儲器的一種極大浪費。而且由於在播放指令發出時，MCU必須對相應的控制線或者IO進行操作，指令的反覆使用也是對CPU資源的浪費。更糟糕的是在播放指令執行過程當中，一旦有中斷等意外發生的話，很容易出現播放異常現象。

播放方法

基於分割播放的一般方法。 OKI的語音晶片為了使控制MCU的開銷最小，在語音晶片產品中加入了ROM Edit功能，通過在製作語音數據時，指定需要復用和延時的部分，把絕大部分處理工作交給語音合成晶片來完成，大幅度降低控制MCU的開銷。例如使用OKI的ROM Edit功能播放圖示的兩段內容時，可以使用下述程式： Play(ROM Edit area1); Play(ROM Edit area2); 語音晶片接受到這兩條指令後，將自行按照ROM Edit領域的指定，自動將相應地址的語音數據進行播放連線，這些過程將無須MCU參與。由於ROM Edit領域中使用的僅僅只是地址信息，所以對於存儲器的占用率是相當低的。當然在ROM Edit領域指定存儲器地址的同時，也可以插入相應的延時信息，由晶片自行完成播放之間的延時處理。 簡單應對多國語言產品開發 如何將同樣的核心設計適用到不同地區的市場，是很多設備生產廠商都要考慮的問題。對於使用語音晶片作為人機互動手段的產品來說，首要面臨的問題就是如何設計多國語言的版本。到目前為止，當提示語言改變時，將不可避免地造成控制軟體的修改，而且針對不同語言的產品必須準備不同版本的語音晶片，給庫存和管理都造成壓力。OKI的語音產品通過存儲器的庫切換功能，輕鬆實現了在同一塊晶片上整合不同語言版本的功能。圖示為在同一塊晶片中存入了中英文兩種語言信息。各種語言信息所對應的事件都是一樣的，使用完全一樣的控制軟體。在設計不同語言的產品時，只需要簡單地將SEL0,SEL1的設定進行相應切換，就可以輕鬆實現同一個設計的中英文版本。OKI的語音晶片最多可以劃分為4個庫，也就是說使用同一塊晶片可以實現4個語種的播放。

語音合成晶片

基本介紹

產生背景

播放方法

相關詞條

熱門詞條