面向視頻偵查的行人重識別關鍵技術研究

面向視頻偵查的行人重識別關鍵技術研究

《面向視頻偵查的行人重識別關鍵技術研究》是依託武漢大學,由梁超擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:面向視頻偵查的行人重識別關鍵技術研究
  • 項目類別:青年科學基金項目
  • 項目負責人:梁超
  • 依託單位:武漢大學
項目摘要,結題摘要,

項目摘要

隨著平安城市工程的深入推進,視頻偵查逐漸成為公安部門打擊和防控刑事犯罪的重要手段。作為其中的關鍵技術,行人重識別,即針對特定行人對象的視頻檢索,發揮著越來越重要的作用。現有的行人重識別方法主要分為兩類:基於代表圖特徵描述的方法和基於距離學習的方法。前者通過抽取部分關鍵幀來表示行人圖像序列。由於遺漏來大量視覺信息,因而匹配結果並不準確。後者的性能提升依賴大量標註樣本,這在實際套用中往往難以有效獲取。為此,本課題提出一整套基於模型表示的行人重識別方法:首先,對對行人對象的圖像序列進行建模,獲得行人外觀的完整表示;其次,採用協同訓練的方法,利用大量未標註樣本來提升基於模型表示的距離學習算法的性能;最後,將雙向驗證的思想引入到行人重識別結果的重排序之中,進一步改善結果的準確率。本課題預期在標準公開數據集上對行人重識別的準確率提升近10%,從而顯著提升視頻偵查工作的效能。

結題摘要

隨著平安城市工程的深入推進,視頻偵查逐漸成為公安部門打擊和防控刑事犯罪的重要手段。作為其中的關鍵技術,行人重識別,即針對特定行人對象的視頻檢索,發揮著越來越重要的作用。本項目面向視頻偵查工作的實際需求,重點研究了行人重識別問題中的特徵表示、距離度量以及排序最佳化等問題。具體而言:在特徵表示方面,我們研究了基於模型表示的行人對象表示方法,利用特徵分布而非特徵向量對行人對象外觀進行表示,使得僅通過少量的個體觀測數據就能夠得到魯棒且準確的對象外觀模型;同時,我們還研究了基於文本描述的行人特徵建模方法,該方法能夠在視覺信息缺失的情況下僅憑現場目擊者的語言描述就準確重構嫌疑目標的外觀特徵;在距離度量方面,我們重點研究了基於特徵投影的距離度量方法和基於數據驅動的自適應尺度修正方法。前者旨在消除攝像頭之間的環境差異,後者則在於根據匹配樣本特點來更好地進行距離度量;在排序最佳化方面,我們重點研究了基於雙向重排、多序列融合和局部反饋等技術的排序最佳化算法,前兩個屬於無監督的排序最佳化技術,而後一個屬於有監督的排序最佳化方法。我們所提方法在標準數據集上較現有國際最好方法在累積匹配率指標上能夠平均提升10%-15%,並在視頻檢索領域最權威的國際性評測Trecvid 2015和2016年實例檢索任務中取得優異成績。項目執行三年以來,我們課題組累積發表學術論文30篇,其中SCI論文10篇,申請發明專利14項(含2項授權),授權軟體著作權2項,2名博士後順利出站,培養博士研究生4人,碩士研究生4人。通過與武漢大千公司的聯合研發,我們的行人重識別算法已經被成功套用於該公司的視頻偵查系統和裝備之中,累積銷售收入2000多萬元,並在南京、武漢等地一線公安部門發揮了重要作用。

相關詞條

熱門詞條

聯絡我們