《雙模態視覺下複雜背景目標檢測與識別》是孫怡峰(中國人民解放軍戰略支援部隊信息工程大學)編制的最終報告。
基本介紹
- 中文名:雙模態視覺下複雜背景目標檢測與識別
- 報告類型:最終報告
- 公開範圍:公開
- 編制時間:2020年12月15日
- 中文摘要
目標檢測與識別是自主無人系統感知世界的基礎,自主無人系統所處背景的複雜性給準確感知帶來挑戰。圖像是以類似於圖片的格式所呈現的數據,與所捕捉到的現場有直接物理對應關係。視覺具有較好的辨識性,視覺感測下套用以深度學習為代表的AI技術,進行目標檢測與識別,有望實現複雜背景下的目標類別、屬性的精細感知,為導航感知、任務感知和操作感知提供有力基礎支撐。在當前技術發展水平和產業背景下,綜合運用紅外模態和可見光模態兩種感測手段,基於紅外圖像處理與人工智慧深度學習兩類技術,取長補短,開展複雜背景下的目標檢測與屬性識別研究,具有重要的學術價值和套用意義。從學術角度,研究有望突破現有技術的弱點,在核心關鍵技術上取得進展,做到自主可控;從套用角度,研究兩種模態下目標檢測與識別互補機制與方法,有望顯著降低成本,在自主無人系統和安防監控的感知能力上取得較大進展,推進無人系統的自主性的提高。 已有的研究中,可見光模態+深度學習進行目標檢測已經取得了很多成果,但仍然存在小目標檢測性能下降較為厲害,細粒度目標區分難,容易受到光照以及雨雪霧霾等氣候條件影響等問題。本研究以目標運動特性、圖像處理以及深度學習技術為抓手,在紅外模態下,開展目標基於運動特性與航跡關聯的目標檢測與虛假過濾技術研究,構建運動檢測與航跡置信度估計方案,在保證檢測率的前提下,顯著降低小目標檢測時的虛警率;在可見光模態下,構建以目標所在區域局部圖像作為輸入的深層神經網路,開展複雜背景下基於深度學習的目標識別研究,設計端到端的目標類別與屬性一體化識別深層卷積神經網路,使得未知目標位置的情況下也能精準獲取目標的類別、顏色、款型等細粒度屬性;在雙模態下,設計紅外目標與可見光目標之間時空對應方案,構建雙模態聯動識別原型系統。