《支持分層細粒度分面檢索的分面分類樹構建方法研究》是依託西北大學,由孫霞擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:支持分層細粒度分面檢索的分面分類樹構建方法研究
- 項目類別:青年科學基金項目
- 項目負責人:孫霞
- 依託單位:西北大學
項目摘要,結題摘要,
項目摘要
現有文獻分面檢索系統大多以學科分類作為主題分面,不能精準反映文獻主題內容,導致針對文獻主題的查詢,退化成傳統的基於關鍵字查詢,降低了文獻主題檢索的可用性,帶來了信息過載問題。為此,本課題擬以特定領域的學術文獻為研究對象,研究支持分層細粒度分面檢索的分面分類樹構建方法。內容包括:1.分層細粒度文獻主題分面模型研究;2.結合文獻主題分面檢索特點,重點解決隱式分面術語及關係獲取、分面分類樹最佳化等問題;3.以Yotta系統中的文獻資源檢索為套用載體,研製原型系統,對所提理論與方法進行測試與驗證。項目特色在於:提出一種分層細粒度分面檢索的新型檢索模式,探索麵向文獻主題的分面分類樹構建方法。本項目有助於豐富與完善信息檢索領域的相關理論與方法,實現基於主題關聯的文獻組織與導航,從而有助於緩解信息過載問題。.預期成果:發表學術論文10篇;培養博士生2名,碩士生3名;國家發明專利1項;研製原型系統。
結題摘要
現有文獻分面檢索系統大多以學科分類作為主題分面,不能精準反映文獻主題內容,導致針對文獻主題的查詢,退化成傳統的基於關鍵字查詢,降低了文獻主題檢索的可用性。為此,項目組研究支持分層細粒度分面檢索的分面分類樹構建方法中的關鍵技術問題。內容包括:1. 層次化細粒度分面模型形式化表示,設計了支持豐富語義的互動式疊代導航操作;2. 針對Wikipedia條目頁面特點,提出了一種逐層特徵投票模型來自動識別領域術語;3. 提出了基於Motif的上下位關係的抽取方法;4. 基於拓撲特徵的分面分類樹生成;5. 為了實現基於分面分類樹的分面檢索,對文獻自動連結算法進行研究,提出了基於數據重構的多層次標籤傳播算法以及基於ELM的多標籤分類算法。支持檢索結果分面分類的檢索方法稱為分面檢索。分面分類樹是分面檢索的核心,可以用於資源的檢索,尤其是非結構化資源的管理與訪問。本項目的研究有助於實現基於主題關聯的文獻組織與導航,從而有助於緩解“信息過載”問題。