索引內容

索引內容

索引(index)是資料庫系統中用於提高檢索查詢速度的數據組織,一般情況下可以顯著提升資料庫系統檢索查詢的性能,也可以快速檢索特定數據和範圍數據以及提升數據值唯一性等。索引內容是指索引數據中哪些屬性或特徵、屬性或特徵的組合。索引內容不僅是指索引資料庫有關屬性,也是指索引圖像中的內容。

基本介紹

  • 中文名:索引內容
  • 外文名:index content
  • 學科:計算機
  • 定義:索引數據哪些屬性或特徵
  • 有關術語:索引
  • 領域:人工智慧
索引內容介紹,圖像檢索,文本檢索,圖像檢測,

索引內容介紹

索引內容是指索引數據中哪些屬性或特徵、屬性或特徵的組合。在人工智慧中,索引內容是指通過有關算法自動地索引文本數據或圖像數據內容,因此文本檢索圖像檢索、圖像檢測都屬於索引內容技術範疇。索引內容本質目的就是索引到感興趣或有用的內容。

圖像檢索

隨著計算機網路的高速發展,以及電腦、手機、數位相機等數位化設備的普及,出現了大量圖像信息。如果想在這些海量的圖像信息中,尋找自己需要的圖像信息,採用傳統的基於文本關鍵字檢索方式就無法滿足用戶的需求,因此基於內容的圖像檢索技術,即 CBIR (Content-Based Image Retrieval)應運而生。CBIR 的核心是使用圖像的底層視覺特徵(顏色、紋理、形狀), 以及圖像高層語義對圖像進行檢索的技術。其基本原理是對表征圖像的底層視覺特徵, 建立圖像特徵資料庫,對這些特徵建立索引,檢索時根據多維特徵向量對圖像進行相似性匹配。
基於顏色特徵的檢索
顏色是圖像最底層、最直觀的物理特徵,一般採用顏色直方圖、顏色相關圖、顏色矩、顏色一致性矢量等方法來描述。目前基於顏色特徵的檢索是套用最為廣泛的檢索方法,主要分為兩類:全局顏色特徵檢索和局部顏色特徵檢索。全局顏色特徵檢索方法目前主要使用色彩直方圖的方法,它是由 Swain 和 Ballad 提出的, 這種方法是根據色彩直方圖統計每種色彩在圖像中出現的機率,然後採用色彩直方圖的交來度量兩幅圖像色彩的相似性,其缺點是不能反應圖像顏色的空間分布。基於這個缺點, 很多人提出了改進的方法:Pass 和 Zabih 等人提出以圖像的色彩聚合矢量作為圖像的索引,是圖像直方圖的一種演變,聚合矢量中的聚合信息在某種程度上保留了圖像色彩的空間信息。Stricker 和Orengo 等提出累加直方圖法, 將圖像分成若干區域,分別對每個區域計算其顏色直方圖,圖像檢索就變成區域顏色直方圖距離的計算,極大地提高檢索的準確性; 同時他們又提出了色彩矩的方法,認為色彩信息主要集中在圖像色彩的低階矩中。這種方法主要對圖像的每種色彩分量的一階、 二階和三階矩進行統計。Hafner 等提出了分級檢索策略,並獲得較好的效果。全局直方圖因其不包含顏色的空間分布關係,往往造成誤檢。局部直方圖方法可以彌補這個缺點,其基本思想是將圖像進行分塊,計算每一個子塊的顏色直方圖,然後比較兩幅圖像相應子塊間的相似距離並進行求和作為整幅圖像的相似距離值。但子塊間的空間約束關係太強,丟失了全局顏色直方圖所具有的旋轉、平移不變性的優點。基於此,Stricker 等提出將圖像劃分成 5 塊互相交疊的區域 (考慮圖像中象素間的相關性),通過對區域中間的象素和靠近邊界的象素設定不同的權重,只能做到有限的旋轉不變性。
基於紋理特徵的檢索
紋理是圖像的某種局部性質,或是對局部區域中像素之間關係的一種度量,其本質是刻畫像素的鄰域灰度空間分布規律。紋理特徵主要包括粗糙度、方向性、對比度以及規則性。紋理特徵描述方法大致可以分為四類:統計法、結構法、模型法、頻譜法。統計方法在頻率域上, 主要採用傅立葉變換和小波分析。傅立葉變換在能量譜上反映圖像粗糙度和方向性;小波分析中採用 Gabor 濾波能夠表現出最好的特徵。在空間域上主要採用由 HaraLick 和 Shanmugam 提出的共生矩陣法。Tamura 法從粗紋度、對比度、方向性、 線性度、 規則度和粗糙度 6 種視覺特徵分析紋理,該法效率比較高。基於紋理的檢索適用於檢索諸如河流、草坪、沙地、布料、建築材料等類型的圖像。
基於形狀特徵的檢索
形狀是刻畫物體最本質的特徵。形狀特徵有面積、主軸方向、環形性、 連通性、偏心率等。對形狀特徵的提取主要是尋找一些幾何不變數。目前用於圖像檢索的形狀描述方法主要有兩類:基於邊緣和基於區域的形狀方法。前者利用圖像的邊緣信息,而後者則利用區域內的灰度分布信息。在基於形狀的圖像檢索中,要解決三個間題。首先,形狀通常與圖像中的特定目標對象有關,因此形狀比顏色和紋理的語義性更強,要獲得目標的形狀參數, 先要進行圖像分割,所以形狀特性會受到圖像分割效果的影響。其次, 目標形狀的描述是一個非常複雜的問題。人對形狀的感覺是視網膜感受和現實世界的知識相結合的結果。事實上, 目前還沒有找到與人的主觀感覺相一致的形狀模型。最後,視角不同所獲得的形狀可能會有很大區別,為能準確匹配形狀,就要解決平移、縮放、旋轉中的不變性等問題。
基於語義特徵的檢索
在實際的查詢中,人們更習慣於依據圖像所描述的對象或事件的語義信息進行圖像相似性判別的,而非是圖像低層視覺特徵的相似。這就造成了人所理解的 “語義相似” 與
計算機理解的“視覺相似” 之間的 “語義鴻溝” 的產生。基於語義特徵的檢索方法的目標是最大限度地減小這種語義鴻溝。目前主要採用半自動或手動的方法提取語義特徵。

文本檢索

文本檢索,亦稱為自然語言檢索,指不對文獻進行任何標引,直接通過計算機以自然語言中的語詞匹配查找的系統。文本檢索進行匹配的對象,可以是整個出版的文本,包括文章、報告甚整本圖書,也可以是它的部分,如文摘、摘錄或只是文獻的題名。以整個文獻正文為對象進行的匹配查找,稱為全文檢索。

圖像檢測

圖像檢測是利用圖像處理與模式識別等領域的理論和方法,從圖像中定位感興趣的目標,需要準確地判斷每個目標的具體類別,並給出每個目標的邊界框。圖像對象檢測在人臉識別、醫學影像、智慧型視頻監控、機器人導航、基於內容的圖像檢索、基於圖像的繪製技術、圖像編輯和增強現實等領域都有廣泛的套用。圖像目標類別檢測是目標分類的一個子問題。目標分類可以分為3個層級:
(1) 圖像級,即確定圖像中是否有相關的目標對象,如圖像分類[、圖像注釋技術。
(2)區域級,即確定圖像中某個區域含有某類目標,即本文所述的圖像目標類別檢測。
(3)像素級,即確定圖像中各像素歸屬於哪類目標對象。像素級分割也分為類別級目標分割和語義分割兩類。類別級目標分割與語義分割的主要區別是,語義分割要求將圖像中的所有目標包括背景都分割出來並確定其類別,而目標分割僅需要分割感興趣的目標並分類。

相關詞條

熱門詞條

聯絡我們