《大規模多視角高維圖像特徵提取》是依託香港理工大學深圳研究院,由黃偉強擔任項目負責人的面上項目。
基本介紹
- 中文名:大規模多視角高維圖像特徵提取
- 項目類別:面上項目
- 項目負責人:黃偉強
- 依託單位:香港理工大學深圳研究院
項目摘要,結題摘要,
項目摘要
大規模多視角高維圖像已經成為大數據的重要組成部分。現有的多視角學習方法僅能用於小型數據集而不適用於大規模多視角高維圖像,故如何高效地提取大規模多視角圖像特徵用於識別與檢索是當前亟待解決的問題。為獲得有效的特徵並適應大數據的存儲與快速搜尋需求,我們提出雙線性投影哈希的思想來發展多視角離散哈希特徵提取理論與算法框架。本項目的研究將進一步豐富大規模多視角圖像特徵提取理論,提高特徵提取的有效性並節省計算量與存儲空間以適應大規模圖像數據處理需求。本項目的研究成果不僅可用於大規模多視角高維圖像分析領域,也可拓展到大規模多模態數據、大數據圖像特徵提取與搜尋等領域,具有重要的理論意義和廣泛的套用前景。
結題摘要
面對大規模多視角圖像的處理及套用需求,現有哈希特徵提取方法在模型建立方面的匱乏以及理論層面上的缺失,使之難以產生有效的特徵表達,因此相關理論體系亟待完善與發展。現總結具體問題如下: (1)現有哈希學習方法只通過考慮哈希函式的構造來學習二值特徵編碼,並沒有把樣本的判別信息加入特徵學習過程,因此其判別能力與表達能力較弱,直接造成二值特徵提取時大量的信息損失。 (2)哈希學習理論與方法尚處研究初期,相關理論體系有待完善,特別是國內外尚未報導有關多視角哈希學習、基於雙線性投影學習的稀疏哈希特徵提取方法。 綜上所述,有必要把多視角雙線性投影學習理論拓展到以哈希表達為對象的分析中。因此針對現有哈希鑑別分析、哈希特徵提取理論與算法存在的問題,本項目一方面解決多視角雙線性投影學習理論向哈希學習理論拓展中出現的問題,另一方面通過引入離散逼近的學習策略來解決基於多視角雙線性投影的哈希特徵提取等問題。具體地,本項目將從以下方面展開研究,即利用小尺度二值矩陣來逼近雙線性投影生成的實數值小尺度矩陣以獲得最優的二值特徵,同時通過對雙線性投影矩陣增加多視角鑑別信息等約束來增強多視角哈希學習的鑑別性,以發展多視角圖像哈希學習理論與算法,並由此形成統一的算法框架以適應大數據時代多視角高維圖像特徵學習與套用的需求。此外,本項目還將多視角哈希特徵提取技術套用到其他的相關領域,以觀察其特點及有效性,挖掘新的套用點。 本項目達到了如下研究目標: (1)發展多視角哈希理論與方法,建立較完善的多視角哈希學習理論與算法框架,開發出集強魯棒性與強鑑別力於一體的多視角哈希學習方法。 (2)在項目期間發表學術論文7篇。其中,在IEEE Transactions on Cybernetics 、IEEE Transactions on Neural Networks and Learning Systems、IEEE Transactions on Image Processing、IEEE Transactions on Circuits and Systems for Video Technology和Pattern Recognition等國際權威雜誌上發表論文5篇。 (3)培養博士後2名,碩士生1名。