《最小化圖像描述子敏感度的大規模圖像索引及檢索方法》是依託華南理工大學,由吳永賢擔任項目負責人的面上項目。
基本介紹
- 中文名:最小化圖像描述子敏感度的大規模圖像索引及檢索方法
- 項目類別:面上項目
- 項目負責人:吳永賢
- 依託單位:華南理工大學
項目摘要,結題摘要,
項目摘要
隨著智慧型手機等攝像設備的迅速普及,網際網路上的圖像數量以幾何級數增長。對海量圖像進行大規模圖像檢索是網上商業活動、日常查詢或醫療、交通等各行業信息檢索中極為重要的套用。海量圖像首先須通過哈希來建立索引以降低檢索時間,與查詢圖像哈希編碼相似的便會被看成相似的圖像子集,然後使用相似度度量對該子集排序後相似度最高的少部分圖像便會被返回給用戶。圖像的色差等變化會改變圖像描述子的值並影響哈希及相似度,我們定義這個影響為敏感度。本項目提出一個最小化描述子特徵敏感度框架來同時研究索引和檢索問題。首先研究最小化量化誤差敏感度的哈希算法以增加相似圖像被劃分到相同哈希碼的機會,然後推廣成層次哈希為哈希碼差一位的圖像提供不同的相似度,再研究最小化敏感度的相似度度量學習算法提升檢索準確率。對哈希後的圖像庫學習相似度來最佳化初始檢索效果,然後基於用戶反饋和敏感度學習進一步提升檢索準確率。最後整合研究結果為一個原型系統。
結題摘要
.大數據環境中每時每刻都有新的數據被產生,高效的檢索和索引方法是有效使用大數據的關鍵科學問題,可是現有的方法都是以給定的固定資料庫為前提,而非針對大數據中數據被不停產生並加入資料庫的環境。其中語義圖像檢索是大數據中一個關鍵套用問題,所以本項目的主要研究內容便是如何在大數據動態環境下有效地進行語義圖像檢索。本項目首次提出大數據動態環境下的語義圖像檢索問題並提出增量哈希方法來解決它,成果已發表在SCI一區的IEEE T-Cyb上,這個研究成果開創了一個新的動態語義圖像檢索領域,打破了傳統只針對給定資料庫的限制,使得基於哈希的圖像檢索方法更為適用於現實的大數據動態環境中,對本領域的研究及套用均有重大影響。另外本項目也提出通過使用不對稱哈希來使用長哈希碼進行檢索及短哈希碼進行存儲以同時提高檢索及存儲效率,並於SCI二區的IEEE TMM上發表並獲得比在發表在其它高水平期刊上的方法更優的檢索效果。而本項目的另一成果兩層哈希方法先把圖像描述向量投映到高維二元空間再過通最小誤差方法投映到低維的二元空間獲得短的哈希碼,有助減少因為直接投從圖像描述向量的實數空間投映到低維二元哈希碼的大量信息掉失,從而獲得更優的哈希檢索效果,該成果已於SCI二區的Neurocomputing上發表。項目已發表9篇高水平科研論文,包括2篇SCI一區、5篇SCI二區文章,另有部分文章在審稿中。綜合而言,本項目的科研產出水平較高,不但開發出比現有方法更好的哈希算法,更開創了大數據動態哈希這個前的研究方向,成果義意重大。