《基於粒計算與語義模板的問答系統研究》是依託上海電力大學,由徐菲菲擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於粒計算與語義模板的問答系統研究
- 項目類別:青年科學基金項目
- 項目負責人:徐菲菲
- 依託單位:上海電力大學
項目摘要,結題摘要,
項目摘要
當前問答系統普遍存在問題分析不足、答案準確率低、智慧型性差等問題,在深入研究粒計算、語義模板的基礎上,我們藉助粒計算理論能發揮模擬人類思維從不同角度、不同層次分析問題的優勢,採用語義和模式相結合的語義模板方法,實現基於粒計算與語義模板的問答系統,使得用戶提出的問題能夠被機器更深層識別和理解,從而提高問答系統的準確率與智慧型性。研究內容重點包括:針對目前模板技術並未考慮調整模板粒度使得問題分析準確率不高等問題,研究語義模板的定義及其粒化方法,以及模板粒度評估策略;針對目前問題分類的精度不高等問題,研究基於粗糙集的問題分類規則提取及相似問題判別方法;針對目前答案獲取的準確率較低等問題,研究答案的粒度層次構建及選取標準,同一問題不同答案的聚類方法。本課題將粒計算理論與語義模板技術進行深層融合併套用到互動式問答系統中,為問答系統的研究提供一種新的有效解決方法,具有重要的理論研究與實際套用價值。
結題摘要
相較於從搜尋引擎獲取信息的方式,用戶在互動式問答系統中通過簡單的提問和回答方式快速準確的獲取所需信息,而不是從搜尋引擎返回的大量相關文檔中繁瑣地去查找信息。用戶互動式問答系統雖然為人們提供了獲取信息的便捷服務,但是依然存在著各種各樣的問題,問題分析和答案的準確度較低是其中最顯著的兩個問題。為了提高用戶互動式問答系統的性能,本項目以粒計算理論為指導思想,首先將語義和模式相結合,給出語義模板的定義;通過對概念的粒度化,我們提出了模板粒度的評估策略SIIPU;實驗結果說明通過調整參數的值,SIIPU模板粒度評估策略能夠非常有效的評價一個模板庫中模板粒度的適合程度,並能幫助系統抽取出高質量的問題模板。其次,針對目前互動式問答系統的數據呈爆炸式增長,為了提高問答系統的問題分類效率和智慧型性,我們將粒計算的約簡理論引入至問答系統,根據不同的數據特點,分別提出了基於互信息的模糊粗糙集並行約簡算法、基於聯合屬性重要度的決策風險最小化約簡算法、多決策表下的區間值全局近似約簡算法;實驗反映出三個算法所選取的屬性均具有較強的分類能力,所獲得的約簡子集都是有效的。進一步,根據互動式問答系統的累積的問題,我們抽取出實詞作為特徵,構造了語義空間,給出特徵的權值計算方法和特徵語義聚類方法,提出了語義空間中問題相似度的計算方法,實驗證明了所提方法具有較高的精度。最後,針對文本的高維數據流特性,我們提出了基於數據流的熵加權軟子空間聚類算法EWSSC;通過實驗給出了數據塊粒度大小的選取方案;從實驗結果來看,EWSSC算法得到了與現有批處理軟子空間聚類算法近乎一致的聚類結果,但節省了更多的運行時間,同時,實驗結果也表明了EWSSC算法在大規模文本數據的聚類問題中可以得到很好的套用。結合以上研究,我們搭建了一個用戶互動式問答原型系統。由此,粒計算理論能發揮模擬人類思維從不同角度、不同層次分析問題的優勢,是解決目前問答系統所面臨主要問題的一條有效途徑。