《面向網路異構信息源的問答資源挖掘》是依託哈爾濱工業大學,由劉秉權擔任項目負責人的面上項目。
基本介紹
- 中文名:面向網路異構信息源的問答資源挖掘
- 依託單位:哈爾濱工業大學
- 項目類別:面上項目
- 項目負責人:劉秉權
- 批准號:61073127
- 申請代碼:F0211
- 負責人職稱:副教授
- 研究期限:2011-01-01 至 2011-12-31
- 支持經費:11(萬元)
項目摘要
當前影響廣泛的線上互動問答社區系統(CQA)存在答案延遲或缺失、答案不完整、噪聲嚴重等突出問題,對存在於網際網路的海量問答資源進行挖掘和整合,形成一個全面準確的問答知識庫,是解決上述問題的關鍵。從具有不同結構和文本特點的信息源中提取問答對知識涉及自然語言處理、機器學習、文本挖掘等領域的諸多方法和技術。本項目面向網際網路中異構的問答信息源,以受限領域的線上互動問答社區系統、線上論壇和普通網頁等典型場景為主要對象,研究如何智慧型化地挖掘和整理在網際網路中廣泛存在的包括用戶在網路交流過程中自然產生的問答資源。涉及的關鍵問題包括:問答對語義相關性計算、答案融合、文本特徵與非文本特徵的最佳化與融合方法、逆向問題生成、增量式線上學習以及問答挖掘的評價標準等。在此基礎上,探索網際網路異構信息資源挖掘的普遍規律和通用方法。本項目的實施對問答系統和自然語言處理研究以及相關網際網路套用的發展有重要推動作用。