《自然語言處理中語言元素的非齊次屬性研究》是依託哈爾濱工業大學,由劉秉權擔任項目負責人的面上項目。
基本介紹
- 中文名:自然語言處理中語言元素的非齊次屬性研究
- 依託單位:哈爾濱工業大學
- 項目類別:面上項目
- 項目負責人:劉秉權
- 批准號:60673037
- 申請代碼:F0211
- 負責人職稱:副教授
- 研究期限:2007-01-01 至 2009-12-31
- 支持經費:26(萬元)
項目摘要
語言元素的非齊次屬性是指語言元素在語料中出現的位置和範圍信息及其特點,是自然語言中的普遍現象,是自然語言語法、語義規律的一種間接體現;針對某些自然語言處理的實驗表明對非齊次屬性規律的充分利用可以有效提高處理精度。本研究基於面向大規模真實語言環境的自然語言處理系統,以當前自然語言處理中的主流統計模型為考察對象,以機率論和資訊理論為理論基礎,研究語言元素的非齊次屬性及其作用規律,包括:非齊次屬性的量化表示方法和統計規律分析;非齊次機率統計模型的基本理論;非齊次機率模型的特徵表示、抽取和組合最佳化;非齊次機率模型的理論評價標準等。在對特定模型齊次化的基礎上總結適合非齊次機率建模的通用原則和基本方法,以期對詞性標註、句法分析等各層次的自然語言分析以及語音識別、音字轉換、信息檢索、機器翻譯、信息抽取、自動文摘等自然語言處理套用的性能提高起到普遍促進作用。