《面向視覺大數據搜尋的詞典學習與特徵編碼壓縮研究》是依託廈門大學,由紀榮嶸擔任項目負責人的面上項目。
基本介紹
- 中文名:面向視覺大數據搜尋的詞典學習與特徵編碼壓縮研究
- 項目類別:面上項目
- 項目負責人:紀榮嶸
- 依託單位:廈門大學
項目摘要,結題摘要,
項目摘要
視覺大數據作為網際網路大數據的核心組成部分,正逐漸成為人工智慧、計算機視覺與多媒體等研究領域的新興研究熱點。為應對面向視覺大數據的內容分析與知識挖掘的挑戰,大規模視覺搜尋技術具有重大研究價值,其成敗的基石取決於如何在海量帶噪的數據環境下獲取魯棒而緊湊的視覺特徵表達。本項目著眼於面向視覺大數據搜尋的魯棒特徵表達與壓縮的研究,主要貢獻是引入一套完善的、針對海量帶噪視覺數據的特徵學習框架,包含如下三個研究點:(1)基於弱監督學習的視覺詞典最佳化構建;(2)基於有監督稀疏編碼和帶約束極值注入的視覺詞包特徵魯棒抽取和(3)面向視覺搜尋的有監督視覺詞典壓縮。這三個貫序的研究點分別對應解決特徵的可擴展性、魯棒性與緊湊性,互為耦合併相互增強。本項目以輸出一套精確而高效的視覺大數據搜尋平台,為內容分析與知識挖掘奠定理論基礎,並促進視覺大數據在多個相關學科領域中的套用。
結題摘要
本項目針對面向視覺大數據搜尋的詞典學習與特徵編碼壓縮展開研究。通過4年的工作,課題組系統性創造性的建立了一套針對海量帶噪視覺數據的特徵學習框架。該框架覆蓋如下三個具體創新點:(1)基於弱監督學習的視覺詞典最佳化構建;(2)基於有監督稀疏編碼和帶約束極值注入的視覺詞包魯棒抽取;(3)面向視覺搜尋的有監督視覺詞典壓縮。課題組以本項目為第一標註共發表論文39篇,超額完成了預期目標,其中包括32篇SCI期刊,7篇CCF A類會議。代表作發表在IEEE Transaction on Image Processing (6篇),International Journal of Computer Vision (1篇), ACM Transactions on Intelligent Systems and Technology (2)篇等CCF A類期刊和JCR一區期刊上,以及ACM Multimedia,AAAI,IJCAI等CCF A類國際會議上。