《基於粗糙集的大規模語料庫語言學知識發現模型研究》是依託哈爾濱工業大學,由王曉龍擔任項目負責人的面上項目。
基本介紹
- 中文名:基於粗糙集的大規模語料庫語言學知識發現模型研究
- 依託單位:哈爾濱工業大學
- 項目類別:面上項目
- 項目負責人:王曉龍
- 批准號:60175020
- 申請代碼:F03
- 負責人職稱:教授
- 研究期限:2002-01-01 至 2004-12-31
- 支持經費:19(萬元)
項目摘要
項目以粗糙集理論為基礎,通過為形式自由的漢語文本構造一個離散的、可變粒度的語言信息表,建立一個可挖掘多種語言學知識的知識發現模型,在此基礎上,通過粗糙集與統計方法的結合,尋找準確、高效的文本數據泛化與約簡算法,最終建立起一個完整、實用的大規模語料庫語言學知識發現理論體系和套用系統,為漢語自然語言處理打下堅實基礎。