《無監督分詞及詞性歸納聯合方法研究》是依託首都師範大學,由王函石擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:無監督分詞及詞性歸納聯合方法研究
- 項目類別:青年科學基金項目
- 項目負責人:王函石
- 依託單位:首都師範大學
項目摘要,結題摘要,
項目摘要
無監督分詞和詞性歸納作為相繼任務,是計算語言學中重要的研究課題,具有較高的理論研究價值和廣闊的套用前景。本研究擬提出無監督分詞及詞性歸納相結合的聯合方法,使分詞和詞性歸納兩個不同層次的統計信息相互補充,以期同時提高兩種不同處理在自然語言理解中的性能。本聯合方法基於申請者先前提出的無監督分詞方法和環境內聚思想,一方面通過獲得基於語素及其類別的不針對特定語言的形態信息,以進一步提高處理精度,另一方面通過獲得一詞多類的歸納結果,以及利用全局統計特徵分辨封閉詞類與開放詞類,以產生接近人工標準和便於人類理解的處理結果,通過提高評估成績達到提升性能的目的。本研究成果將為構建包含語法歸納在內的更大規模的無監督聯合方法奠定基礎。
結題摘要
無監督分詞和詞性歸納作為相繼任務,是計算語言學中重要的研究課題,具有較高的理論研究價值和廣闊的套用前景。本研究擬提出無監督分詞及詞性歸納相結合的聯合方法,使分詞和詞性歸納兩個不同層次的統計信息相互補充,以期同時提高兩種不同處理在自然語言理解中的性能。本聯合方法基於申請者先前提出的無監督分詞方法和環境內聚思想,一方面通過獲得基於語素及其類別的不針對特定語言的形態信息,以進一步提高處理精度,另一方面通過獲得一詞多類的歸納結果,以及利用全局統計特徵分辨封閉詞類與開放詞類,以產生接近人工標準和便於人類理解的處理結果,通過提高評估成績達到提升性能的目的。本研究成果將為構建包含語法歸納在內的更大規模的無監督聯合方法奠定基礎。