《基於Wiki的垂直搜尋語義技術研究》是依託天津理工大學,由趙德新擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於Wiki的垂直搜尋語義技術研究
- 項目類別:青年科學基金項目
- 項目負責人:趙德新
- 依託單位:天津理工大學
項目摘要,結題摘要,
項目摘要
目前的Web搜尋技術只是部分地解決海量信息資源的發現問題,信息的查全率和精確度仍然不能滿足用戶的需求。本項目針對當前的全球資訊網環境下垂直搜尋引擎的特點,利用維基百科豐富的語義資源,將傳統信息檢索技術與語義Web技術相結合,最佳化信息檢索過程。具體內容包括:提出知識單元的語義表示方法,挖掘Wiki豐富的結構化語義關係,構建概念間的語義關聯矩陣;給出主題爬蟲的網頁主題相關性度量方法,構建動態主題語義詞典,提出垂直搜尋引擎的查詢自動分類算法;針對具有語義數據格式的文檔索引,對語義信息進行不同粒度的解析,建立語義三層索引模型;提出語義搜尋模型及其結構框架,對描述邏輯進行模糊擴展,以增加本體描述語言的模糊概念表達能力,探討基於模糊Tableaux的可滿足性推理算法。本項目的研究對探索實現智慧型搜尋引擎具有重要的實際套用價值。
結題摘要
目前的Web搜尋技術只是部分地解決海量信息資源的發現問題,信息的查全率和精確度仍然不能滿足用戶的需求。本項目針對當前的全球資訊網環境下垂直搜尋引擎的特點,利用維基百科豐富的語義資源,將傳統信息檢索技術與語義Web技術相結合,最佳化信息檢索過程。研究取得了以下成果: 1)提出了基於Wiki的語義相似度計算方法WLA,挖掘Wiki豐富的結構化語義關係,構建概念間的語義關聯矩陣,基於網頁主題相關性度量方法,構建了動態主題語義詞典; 2)提出了垂直搜尋引擎的查詢自動分類算法Bagging_BSJ,該算法集成了三種基分類器,提高了查詢的準確率和召回率; 3)針對具有語義數據格式的文檔索引,根據索引對象特徵對語義信息進行不同粒度的解析,建立語義三層索引模型來滿足用戶的多種查詢需求; 4)建立了語義搜尋模型並開發了原型系統,提出基於用戶查詢意圖的主題搜尋排序算法,對描述邏輯進行模糊擴展,以增加本體描述語言的模糊概念表達能力。實驗測試了多個數據集上前50條命中記錄的查準率和查全率,我們系統的查準率不低於86%,查全率不低於80%,回響時間小於1秒。 總之,本項目的研究對探索實現智慧型搜尋引擎具有重要的實際套用價值,達到了預期的目標,取得了一系列科研成果,其中SCI檢索論文1篇,5篇EI檢索論文,2篇國際會議論文(EI檢索周期中),軟體著作權2項,申請專利1項,培養了6名碩士研究生。