面向大數據跨媒體檢索的多模態哈希學習方法研究

《面向大數據跨媒體檢索的多模態哈希學習方法研究》是依託哈爾濱工業大學,由翟德明擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:面向大數據跨媒體檢索的多模態哈希學習方法研究
  • 依託單位:哈爾濱工業大學
  • 項目類別:青年科學基金項目
  • 項目負責人:翟德明
項目摘要,結題摘要,

項目摘要

為了應對大數據所帶來的存儲代價大、檢索效率低等難題,基於哈希的方法近年來受到了越來越多人的關注和認可。基於哈希的方法最吸引人的特性為將數據表示成二進制的哈希編碼來索引,不僅具有更緊緻的表示,縮小了存儲空間,且採用二進制哈希編碼計算複雜度更低。本項目將面向跨媒體檢索,在以往相關工作的基礎上,針對大數據特徵空間所具有的多模態、高維非線性問題,研究新的非線性多模態哈希學習方法以及在具體的套用問題中所需的特定技術。具體研究目標包括:(1) 提出新的非線性多模態哈希學習算法,並利用局部學習,更好的建模大數據的複雜結構,並對算法的各項性能做出分析與證明; (2) 基於圖像分布的流形特徵和對有監督信息的主動選擇,提出融入主動學習、流形學習的半監督多模態哈希學習方法; (3) 所提出的新方法將套用於大數據跨媒體檢索系統,以期望提高這些系統的查詢精度、召回率和效率。

結題摘要

本課題以多媒體大數據為套用背景,著重研究基於哈希函式學習的離散二值化編碼和海明距離計算的核心技術和方法,併兼顧圖像處理相關技術在大規模圖像視頻存儲、檢索、推薦系統以及視頻會議等實際套用問題。在國際頂級期刊上發表研究型長文7篇。在以下幾個方面取得了重要研究進展:1、提出了一種面向大數據多媒體檢索的有監督分散式哈希學習技術,該技術在性能損失差別不大的情況下,大大節省了通訊代價、存儲代價,節約了時間開銷,特別適用於如手機端、客戶端、或大數據多終端等場景下的分散式大規模多媒體檢索;2、提出一種新型的參數化局部多視海明距離度量學習方法,更好的建模了大數據的複雜結構,在跨媒體檢索中取得了較傳統方法更好的性能;3、提出了一種面向大規模推薦系統的離散正則化協同濾波技術。實驗結果證明該技術能夠進一步提升推薦效率和準確率,在現實的大規模推薦系統中更加有效。4、提出了一種基於雙重稀疏約束的先驗模型,針對視頻會議中的注視點缺失問題,基於此先驗,進一步提出了一種聯合注視點糾正與人臉美化的框架。可以有效的糾正視頻會議中對話人的視點不相交問題,同時提升對話人的面部美化程度。該技術對線上約會,線上求職等多網路社交活動中具有廣泛的套用前景。

相關詞條

熱門詞條

聯絡我們