《基於隱式字典深度學習的圖像分類識別研究》是依託深圳大學,由楊猛擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於隱式字典深度學習的圖像分類識別研究
- 項目類別:青年科學基金項目
- 項目負責人:楊猛
- 依託單位:深圳大學
項目摘要,結題摘要,
項目摘要
圖像分類識別是對圖像進行更高層理解和分析的基石,它在幾乎所有計算機視覺系統中都扮演重要角色。但與人類視覺相比,目前計算機圖像分類識別能力還比較落後,不能完全滿足實際套用需求。字典學習符合人眼視覺機理,同時便於設計判別性更強的分類器以及適用性和鑑別性更強的圖像描述。鑒於此,本項目將根據視覺皮層模型的層級感知機制,提出一種具有視覺信息層級感知能力的字典深度學習分類框架;在字典深度學習的不同層級,我們將學習隱式判別字典來自動建立字典元素與類別的關聯關係,增強字典的表示和鑑別能力;同時在最終分類階段提出多量測判別字典融合學習來有效利用數據的多量測信息。通過借鑑視覺皮層模型和深度學習,我們將嘗試通過隱式判別字典的深度多層級學習來模擬人眼視覺感知,產生新的、具有更高性能的圖像分類識別器,縮小計算機在模式識別方面和人類的差距。項目研究將大大加深人們對大腦視覺系統的理解,具有重要的學術研究價值和社會意義。
結題摘要
圖像分類識別是對圖像進行更高層理解和分析的基石,它在幾乎所有計算機視覺系統中都扮演重要角色。但與人類視覺相比,目前計算機圖像分類識別能力還比較落後,不能完全滿足實際套用需求。字典學習符合人眼視覺機理,同時便於設計判別性更強的分類器以及適用性和鑑別性更強的圖像描述。項目組研究了受視覺皮層模型啟發的深度多層級圖像分類算法。在深度多層級學習方向研究了大間隔深度學習框架、局部自適應深度學習和從底向上的多層字典學習框架;在挖掘字典元素類別關係的判別字典學習方向,研究了設定類別通用和類別專用混合的判別字典學習方法、自適應估計字典元素類別關係的算法、分析合成字典、半監督字典和魯棒字典學習模型;在多量測字典融合學習方向,研究了多特徵聯合字典表示學習的融合算法、多特徵聯合字典協同表示的模型、以及利用多核思想更加有效利用數據鑑別性的模型。 這些模型提出了具有更高性能的圖像分類識別器,縮小計算機在模式識別方面和人類的差距。項目研究加深了人們對大腦視覺系統的理解,具有重要的學術研究價值和社會意義 項目團隊針對項目內容進行了深入研究,發表學術論文31篇,其中包括《Pattern Recognition》、《IEEE Trans. Multimedia》、《Neurocomputing》等中科院二區SCI期刊論文9篇,其他SCI期刊論文4篇,1篇章節論文,包括AAAI 2017, AAAI 2016, ICML 2016, ICME 2015等在內的國際/國內會議論文17篇,申請相關發明專利4項。