《基於統計流形的局部視覺特徵層次化索引研究》是依託西安電子科技大學,由崔江濤擔任項目負責人的面上項目。
基本介紹
- 中文名:基於統計流形的局部視覺特徵層次化索引研究
- 項目類別:面上項目
- 項目負責人:崔江濤
- 依託單位:西安電子科技大學
中文摘要,結題摘要,
中文摘要
可視媒體理解領域的關鍵問題之一是海量視覺特徵的高效匹配。本課題針對局部特徵集合中高維、多量特性帶來的存儲、計算複雜度過高的問題,研究海量局部特徵的高效索引與匹配。局部特徵集合的緊緻表示是高效匹配的關鍵。本課題首次提出運用信息幾何學中的統計流形方法,對局部特徵集合建立統計模型,採用費舍爾信息距離匹配機率密度信息,實現統計分布信息的低維流形嵌入,生成局部特徵集合的緊緻描述向量。在此基礎上,建立從集合整體到局部元素的層次化索引結構和計算模型,實現局部特徵的高效匹配。統計流形方法能夠實現高維統計分布信息的高效表達,而層次化模型符合人類的視覺認知習慣。本課題將二者有機結合,其特色是能夠降低局部特徵的存儲和計算複雜度、提高匹配效率,並且能夠滿足海量可視媒體套用對檢測精度和檢索速度的不同需求。
結題摘要
視覺媒體智慧型處理領域的關鍵問題之一是海量視覺特徵的高效表達與計算。課題針對局部視覺特徵海量、高維特性帶來的存儲、計算複雜度過高的問題,研究海量視覺特徵的數據組織與計算方法,主要包括視覺特徵提取與表達、高維索引、最近鄰查詢、局部視覺特徵集合高效匹配等。課題重點對海量複雜高維數據的高效計算,嘗試從三個層面來對其進行緊緻描述:維數縮減、數據尺寸縮減、尋找影響力最大的數據點。處理的數據類型包括高維向量,高維向量集合,稀疏矩陣(圖)。在對複雜高維數據進行緊緻描述的基礎上,進一步研究海量數據的高效組織與計算,主要包括基於哈希和矢量量化的高維索引技術、最近鄰查詢技術等。 課題取得的主要成果包括:(1) 採用統計流形學習方法,提出了一種針對視覺直方圖數據(BOF和SPM)的維數縮減框架,在不降低圖像特徵的表達能力的前提下,將原始高維直方圖數據嵌入到合適的低維歐氏空間,構建更為緊湊且具有強辨識能力的BOF表達模型。該成果的一個重要發現是,對於高維BOF數據,緊緻的低維表達能取得更好的分類和查詢效果。進一步,可以對降維後的BOF特徵進行哈希表示。(2) 針對高維數據的哈希表示,定義了一種新的複合LSH鍵值距離度量方式來估算真實距離,通過設計一種哈希鍵值的線序機制實現原始高維數據的有序組織,保證了候選數據的局部分布,大大地改善了近似最近鄰查詢效率。其重要意義在於,解決了LSH方法進行近似最近鄰查詢時的I/O性能瓶頸,在保證查詢精度的基礎上極大地提高了最近鄰查詢速度;(3) 分別通過改善全局視覺特徵提取和最佳化SVM學習方案提高了視覺特徵匹配效率。一方面,鑒於局部視覺特徵的高維、多量特性對圖像匹配效率造成的影響,提出了一系列基於矩分析的全局視覺特徵提取方法,提升了視覺特徵的表達能力;另一方面,設計了一系列最佳化的SVM模型,改善了視覺特徵學習機制;(4) 課題將對高維數據有效表達的研究延伸到社交媒體網路中,將圖數據看成是稀疏矩陣,在對節點複雜高維特徵矩陣分析的基礎上,設計了一系列有效模型來發現影響力最大化的節點。 本課題的研究對降低海量高維數據的存儲和計算複雜度,並且有效套用於視覺分類、識別和檢索等具有很好的理論意義和套用價值。本課題取得了很好的理論研究和套用成果,其中錄用或發表學術論文15篇,授權或公示國家發明專利5項。學術論文包括2篇頂級CCF A類會議論文,以及10篇SCI索引論文。