《基於低秩矩陣學習的多源排序融合關鍵技術研究》是依託中山大學,由潘炎擔任項目負責人的面上項目。
基本介紹
- 中文名:基於低秩矩陣學習的多源排序融合關鍵技術研究
- 項目類別:面上項目
- 項目負責人:潘炎
- 依託單位:中山大學
中文摘要,結題摘要,
中文摘要
在信息檢索和推薦系統中,對檢索/推薦結果的排序是最核心的研究問題。排序是搜尋引擎,產品推薦、精準廣告投放等重要套用中的關鍵技術。排序融合是指分別通過多種不同來源的特徵或多種算法獲得搜尋/推薦結果的多個基本排序,然後把這些基本排序融合得到一個更好的排序。排序融合是一種不需要人工標註數據的無監督方法,因而可適用於網際網路元搜尋,各種推薦系統,機器翻譯,機器學習中的預測結果融合等問題中。實際套用中輸入數據不完整,高噪聲和規模大給已有的排序融合方法帶來了重要挑戰。本課題擬研究基於低秩矩陣學習的排序融合方法。首先,擬提出用低秩矩陣來建模待排序對象間的先後序關係,並用結構化稀疏的矩陣來建模對象關係中的噪聲結構;針對基於低秩矩陣的排序融合模型和噪聲結構,提出相應的目標函式和最佳化算法;針對實際套用中數據規模大的問題,擬提出基於分治思想的排序融合的近似學習算法;分析排序融合的成功條件和分治近似錯誤。
結題摘要
在信息檢索和推薦系統中,對檢索/推薦結果的排序是最核心的研究問題。排序融合方法廣泛套用於網際網路元搜尋,推薦系統,機器學習中的預測結果融合等問題中。實際套用中輸入數據不完整,高噪聲和規模大給已有的排序融合方法帶來了重要挑戰。 本課題研究基於低秩矩陣學習的排序融合方法,並將其擴展到多視圖聚類、多任務學習等結構相似的機器學習問題上。首先,提出用低秩矩陣來建模待排序對象間的先後序關係(或聚類對象的相似/不相似關係),並用結構化稀疏的矩陣來建模對象關係中的噪聲結構;針對基於低秩矩陣的排序融合模型(或聚類模型)和噪聲結構,提出相應的目標函式和最佳化算法;針對實際套用中數據規模大的問題,提出基於分治思想的近似學習算法。另外,本課題還研究了基於深度學習的哈希方法及其在檢索和排序中的套用。 本課題的代表性成果包括:在AAAI,CVPR,ECCV等權威國際會議上發表論文5篇(其中CCF A類會議論文3篇);在IEEE Transactions期刊上發表(含錄用)論文5篇。其中,AAAI 2014的論文“Supervised Hashing for Image Retrieval via Image Representation Learning”在Google Scholar上的引用次數為195次,CVPR 2015的論文“Simultaneous Feature Learning and Hash Coding with Deep Neural Networks”在Google Scholar上的引用次數為183次;AAAI 2014的論文“Robust Multi-View Clustering via Low-rank and Sparse Decomposition”在Google Scholar上引用次數為78次。