《CBIR中的高層語義特徵提取和多特徵的因素空間分析方法》是依託北京工商大學,由李裕梅擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:CBIR中的高層語義特徵提取和多特徵的因素空間分析方法
- 項目類別:青年科學基金項目
- 項目負責人:李裕梅
- 依託單位:北京工商大學
項目摘要,結題摘要,
項目摘要
針對圖像基於內容檢索(Content-Based Image Retrieval,簡稱CBIR)中的多特徵綜合和圖像高層語義特徵提取與表達進行研究。首先為CBIR引入一種新的圖像特徵進行屬性表達,即基於生物學啟發的特徵(Biologically-inspired Feature,簡寫BIF),在此基礎上結合提取圖像的其他低層視覺特徵,從而得到圖像的多種單一特徵;然後用模糊集理論上發展起來的因素空間理論對圖像的多特徵進行分析,尤其是用因素空間理論中變權的思想分析出圖像各種特徵的重要性,從而形成圖像的低層綜合特徵;再者,針對人們通常具有根據圖像語義特徵進行圖像檢索的習慣以及其中存在的各種問題,深入研究模糊邏輯理論中變論域的思想在圖像高層語義特徵提取中的套用,這裡主要是在已經提取出來的多種單一特徵及其綜合特徵的基礎上提取語義特徵;最後根據圖像的低層綜合特徵和高層語義特徵一起完成圖像檢索。
結題摘要
針對彩色圖像的基於內容檢索,蒐集了12個圖片庫,選用圖片特徵中,顏色特徵有:HSV顏色直方圖、顏色布局、顏色相關直方圖、加權主顏色、顏色聚合向量等;紋理特徵有:灰度共生矩陣、LBP的幾種形式;形狀特徵有:邊緣直方圖、HOG、SIFT的幾種形式. 將這些特徵進行組合以便更加全面的表達圖片內容,而且在個別單一特徵提取過程中還用到動態金字塔策略,特徵組合後採用了PCA降維. 檢索系統,一是用歐氏距離進行相似性比較以尋找和查詢圖片相似的圖片,二是再進一步採用SVM集成分類器反饋的檢索. 在SVM集成分類器反饋檢索中,還設計了非對稱正樣本打包和非對稱負樣本打包策略解決反饋過程中的正負樣本不均衡的問題,採取了隨機子空間策略抽取不同特徵維度進行實驗,由此構造出多個SVM分類器用於檢索. 在Corel 1000圖片庫上分析和試驗了約24個特徵組合方案,在SIFT的幾種形式和LBP的幾種形式以及其他幾種顏色特徵(比如顏色相關直方圖、顏色聚合向量等)組合之前,進行了HSV顏色直方圖、邊緣直方圖、灰度共生矩陣、3D-LBP、HOG以及基於小波變換的特徵組合,得到四個特徵組合方案,效果最好的是第四個:HSV顏色直方圖的動態提取和3D-LBP基礎上的小波變換以及HOG特徵的提取等,並撰寫了一篇論文和一個專利;後來加入sift幾種形式的關鍵點特徵和其他幾種形式LBP紋理特徵,又找到其他顏色特徵(比如顏色自相關直方圖、顏色布局、加權主顏色、顏色聚合向量等),經過了20個特徵組合的檢索實驗,最終得到檢索效果最好的是:動態提取的128維顏色相關直方圖和R、G、B三通道各提取的59維一致LBP共177維紋理特徵以及200維rg-SIFT特徵組合方案,在用歐式距離比較相似性的前提下的前20的平均查準率達到78.57%、前100平均查全率已經達到56.359%,這兩個指標已經超越了我們關注到的所有在Corel 1000圖片庫上試驗的文獻,撰寫論文一篇. 然後在SVM集成分類器檢索環境下,得到前20的平均查準率為92.26%, 前40的平均查準率為81.563%, 以及前100的平均查全率為60.577%,鑒於反饋檢索指標的又一次大幅提升,再次撰寫論文一篇.