統計式的語言模型

統計式的語言模型是藉由一個機率分布,而指派機率給字詞所組成的字串。

基本介紹

  • 中文名:統計式的語言模型
  • 內容:機率分布
  • 套用:然語言處理
  • 依據機率
統計式的語言模型是藉由一個機率分布,而指派機率給字詞所組成的字串:
語言模型經常使用在許多自然語言處理方面的套用,如語音識別機器翻譯,詞性標註,句法分析和資訊檢索。由於字詞與句子都是任意組合的長度,因此在訓練過的語言模型中會出現未曾出現的字串(資料稀疏的問題),也使得在語料庫中估算字串的機率變得很困難,這也是要使用近似的平滑n元語法(N-gram)模型之原因。
在語音辨識和在資料壓縮的領域中,這種模式試圖捕捉語言的特性,並預測在語音串列中的下一個字。
當用於資訊檢索,語言模型是與檔案有關的集合。以查詢字“Q”作為輸入,依據機率將檔案作排序,而該機率代表該檔案的語言模型所產生的語句之機率。

相關詞條

熱門詞條

聯絡我們