華為機器學習服務自動語音識別

華為機器學習服務自動語音識別(ML Kit ASR)支持將實時輸入的語音轉換為文本,可實時識別60秒內的語音。

基本介紹

  • 軟體名稱:華為機器學習服務自動語音識別
  • 外文名:HMS ML Kit Automatic Speech Recognition
  • 所屬學科:計算機語音語言類
定義,主要特點,套用,

定義

華為機器學習服務自動語音識別(ML Kit ASR)支持將實時輸入的語音轉換為文本,可實時識別60秒內的語音。目前支持中文國語(包括中英文混說)、英文、法語、德語、西班牙語、義大利語的識別。

主要特點

  • 支持實時出字。
  • 提供拾音界面、無拾音界面兩種方式。
  • 支持端點檢測,可準確定位開始和結束點。
  • 支持靜音檢測,語音中未說話部分不傳送語音包。
  • 支持數字格式的智慧型轉換,例如語音輸入“二零二零年”時,能夠智慧型識別為“2020年”。

套用

實時語音識別服務覆蓋日常生活及工作中的眾多領域。並且深度最佳化了購物搜尋、影視搜尋、音樂搜尋以及導航等場景中的識別能力,進一步提高這幾類場景的識別準確率。
在使用購物類App搜尋商品時,可以將語音描述的商品名稱或特徵識別為文字從而搜尋到目標商品。同樣,在使用音樂類App時,可以將語音輸入的歌名或歌手識別為文字進而搜尋歌曲。另外,司機在駕駛過程中不方便輸入文字時,可以將輸入的語音轉換為文字繼而搜尋目的地,讓行車更加安全。

相關詞條

熱門詞條

聯絡我們