基於機器學習的相關反饋算法中若干關鍵問題研究

基於機器學習的相關反饋算法中若干關鍵問題研究

《基於機器學習的相關反饋算法中若干關鍵問題研究》是依託杭州電子科技大學,由葉正擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於機器學習的相關反饋算法中若干關鍵問題研究
  • 項目類別:青年科學基金項目
  • 項目負責人:葉正
  • 依託單位:杭州電子科技大學
項目摘要,結題摘要,

項目摘要

偽相關反饋是解決信息檢索過程中詞不匹配問題的有效手段,是提高信息檢索準確率和召回率的關鍵技術之一。在傳統基於查詢擴展的偽相關反饋技術中,由於假設初次檢索得到前K篇文檔為相關文檔,使得(1)當初次檢索返回文檔集質量不高時,容易引入噪音;(2)不同質量反饋文檔無法區分對待。本課題重新審視偽相關反饋的基礎假設,研究如何挖掘網路資源和使用機器學習技術來解決偽相關反饋中若干關鍵問題,進一步提高基於查詢擴展的相關反饋技術的性能:(1)引入新的基於質量偏重相關反饋假設,並提出面向相關反饋文檔質量評估模型;(2)引入新的基於主題相關反饋假設,並提出查詢相關反饋主題提取算法;(3)提出基於多種外部資源的反饋模型,解決首次查詢精度較差時,反饋文檔質量無法得到保證的問題。

結題摘要

偽相關反饋是解決信息檢索過程中詞不匹配問題的有效手段,是提高信息檢索準確率和召回率的關鍵技術之一。在傳統基於查詢擴展的偽相關反饋技術中,由於假設初次檢索得到前K篇文檔為相關文檔,使得(1)當初次檢索返回文檔集質量不高時,容易引入噪音;(2)不同質量反饋文檔無法區分對待。本課題主要研究如何挖掘網路資源和使用機器學習技術進一步提高基於查詢擴展的相關反饋技術的性能:(1)引入新的基於質量偏重相關反饋假設,並提出面向相關反饋文檔質量評估模型;(2)引入新的基於主題相關反饋假設,並提出查詢相關反饋主題提取算法;(3)提出基於多種外部資源的反饋模型,解決首次查詢精度較差時,反饋文檔質量無法得到保證的問題。

相關詞條

熱門詞條

聯絡我們