信息檢索中基於損失函式最佳化的排序學習研究

《信息檢索中基於損失函式最佳化的排序學習研究》是依託南開大學,由黃亞樓擔任項目負責人的面上項目。

基本介紹

  • 中文名:信息檢索中基於損失函式最佳化的排序學習研究
  • 項目類別:面上項目
  • 項目負責人:黃亞樓
  • 依託單位:南開大學
  • 批准號:60673009
  • 研究期限:2007-01-01 至 2009-12-31
  • 申請代碼:F0210
  • 支持經費:26(萬元)
  • 負責人職稱:教授
中文摘要
排序學習是信息檢索模型研究的熱點問題。基於前期的研究工作,我們發現在該領域存在以下兩個問題:[1] 在信息檢索中,人們注意到了序對顛倒導致的錯誤,並提了解決方案,但是這種顛倒出現的位置並未被考慮。事實上出現在序頂部的錯誤要比出現在序中部或者尾部的錯誤要更加嚴重,其對排序性能的影響更大;[2] 排序學習需要大量的人工標註數據,但在信息檢索中數據的標註代價非常昂貴,如何利用大量存在的未標註的數據訓練排序模型值得探討。已有的排序學習研究沒有對以上兩個問題做出深入的探討,本項目以用於排序學習的損失函式為切入點,借鑑機器學習中分類學習的套用經驗,提出基於代價敏感學習的排序算法來解決第一個問題,提高排序的性能(序的準確性);提出用於排序學習的半監督學習方法和主動學習方法來解決第二個問題,降低標註代價。研究成果除用於信息檢索外,在其他需要排序學習的相關領域,如經濟學、社會科學等領域都有著廣泛套用。

相關詞條

熱門詞條

聯絡我們