半監督排序學習理論與算法研究

半監督排序學習理論與算法研究

《半監督排序學習理論與算法研究》是依託中山大學,由潘炎擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:半監督排序學習理論與算法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:潘炎
  • 依託單位:中山大學
中文摘要,結題摘要,

中文摘要

在信息檢索系統中,對檢索結果的排序一直是最核心的研究問題。排序在網際網路搜尋引擎,協同過濾、自動問答,自然語言理解等領域都有廣泛套用。近年來,研究者把機器學習用於排序問題上,提出了排序學習(Learning to Rank),並逐漸成為了信息檢索和機器學習中的一個活躍的研究方向。目前,大部分已有的排序學習研究都採用全監督學習的方式。本課題擬研究半監督的排序學習理論與算法。首先,針對半監督排序中需要處理非常大規模的未標註數據的問題,擬提出基於隨機次梯度下降和投影的快速學習算法;針對未標註數據中含有較多噪聲的特點,擬研究採用稀疏學習模型來抵禦噪聲,並採用關聯規則從未標註數據中抽取可信度高的信息;研究半監督排序的泛化錯誤上界分析,學習的持續改進條件等。

結題摘要

本項目主要研究通過半監督的排序學習方法來提高信息檢索系統中的檢索結果的排序準確率。項目的研究工作按照預定計畫來開展,完成了預期的目標。具體地,我們完成了以下三方面的研究內容:(1)提出了兩種半監督的排序學習算法,包括基於關聯規則的直推式排序學習,基於對象相關性的值推式排序學習;(2)提出了兩種基於稀疏模型的排序學習的算法,以更好地抵禦數據中的噪聲;(3)提出了基於低秩矩陣學習的排序學習模型,以及相應的針對大規模數據的分而治之的學習算法。 項目的研究成果包括一流國際會議論文兩篇(分別發表在AAAI 2013和CVPR 2013,均為CCF A類國際會議),SCI期刊論文8篇(包含IEEE Transactions長文4篇,其中3篇為CCF A類國際期刊,1篇為CCF B類國際期刊),國內重要期刊論文1篇;獲得國際權威評測PASCAL VOC 2012 Challenge的物體分類比賽冠軍,百度公司的“火眼金睛——快速識別人像”比賽的第二名,默克製藥公司的藥物分子活性預測比賽的第四名。以開放原始碼形式發布排序學習算法FenchelRank。

相關詞條

熱門詞條

聯絡我們