概念
圖像是客觀景物在人腦中形成的影像,是人類最重要的信息源,它是通過各種觀測系統從客觀世界中獲得,具有直觀性和易理解性。圖像處理正顯著地改變著人們的生活方式和生產手段,比如人們可以藉助於圖像處理技術欣賞月球的景色、交通管理中的車牌照識別系統、機器人領域中的計算機視覺等,在這些套用中,都離不開圖像處理和識別技術。圖像識別是利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。
圖像目標識別是通過存儲的信息(記憶中存儲的信息)與當前的信息(當時進入感官的信息)進行比較實現對圖像的識別。前提是圖像描述,描述是用數字或者符號表示圖像或景物中各個目標的相關特徵,甚至目標之間的關係,最終得到的是目標特徵以及它們之間的關係的抽象表達。圖像識別技術對圖像中個性特徵進行提取時,可以採用
模板匹配模型。在某些具體的套用中,圖像識別除了要給出被識別對象是什麼物體外,還需要給出物體所處的位置和姿態以引導計算初工作。圖像識別技術已廣泛套用於多個領域,如生物醫學、衛星遙感、
機器人視覺、貨物檢測、目標跟蹤、自主車導航、公安、銀行、交通、軍事、電子商務和多媒體網路通信等。隨著技術的發展,出現了基於
機器視覺的目標識別、基於
深度學習的目標識別等,大大提高了圖像識別的準確度和識別效率。
主要步驟
圖像預處理
圖像預處理需要對圖像進行平移、旋轉和縮放等幾何規範,使得圖像識別能夠快速、準確。同時,圖像濾波的主要目的是在保持圖像特徵的狀態下進行噪聲消除,其可分為線性濾波和非線性濾波。與線性濾波相比,
非線性濾波能夠在去噪的同時保護圖像細節,是圖像濾波方法中研究的熱點。非線性濾波中具有代表性的是
卡爾曼濾波和粒子濾波。
圖像分割
圖像分割是實現機器視覺圖像自動識別與分析的重要問題,其分割質量對後續圖像的分析具有重要影響。快速、精確地將特徵目標從複雜的圖像中分割出來一直是國內外學者的研究重點。圖像分割可採用 3 種途徑,即區域分割、邊界分割和邊界形成分割。
特徵提取
作為
機器視覺圖像目標識別的一個中間節點,
特徵提取對目標識別的精度和速度具有重要影響。從複雜的圖像信息中提取有用的特徵,對實現機器視覺的目標識別起到決定性的作用。根據不同分類方法,可將圖像特徵分為多種類型,例如可根據區域大小分為全局特徵和局部特徵,根據統計特徵分為矩特徵、輪廓特徵及紋理特徵等。與全局特徵相比,用局部特徵在複雜的背景下對圖像目標進行描述非常高效,常用的檢測方法有稀疏選取、密集選取和其他方法選取。從現有的研究成果來看,這3 類方法都有一定的不足——對圖像目標背景依賴性大,因此,採用多種描述子進行機器視覺的圖像目標識別是一種發展趨勢。
對於圖像特徵提取,不同的描述子不斷被提出,其中,GLOH(Gradient location orientation histograms)和
SIFT(Scaleinvariant feature transform)描述子性能穩定,套用較為廣泛;SURF(Speeded-up robust features)描述子在圖像目標特徵明顯時能夠快速識別,套用效果較好。除此之外,不變矩和導向濾波器在低維描述子中表現較好。
主要識別技術
指紋識別
指紋識別是生物識別技術中一種最實用、最可靠和價格便宜的識別手段,主要套用於身份驗證。指紋識別是生物特徵的一個部分,它具有不變性:一個人的指紋是終身不變的;唯一性:幾乎沒有兩個完全相同的指紋。一個指紋識別系統主要由指紋取像、預處理與特徵提取、比對、資料庫管理組成。指紋識別技術與我們的現實生活緊密相關,如信用卡、醫療卡、考勤卡、儲蓄卡、駕駛證、准考證等。
人臉識別
大多數人臉識別系統使用可見光或紅外圖像進行
人臉識別,可見光圖像識別性能很容易受到光照變化的影響。在戶外光照條件不均勻的情況下,其正確識別率會大大降低。而紅外圖像進行人臉識別時可以克服昏暗光照條件變化影響,但由於紅外線不能穿透玻璃,如果待識別的對象戴有眼鏡,那么在圖像識別時,眼部信息全部丟失,將嚴重影響人臉識別的性能。
文字識別
文字識別是將模式識別、文字處理、人工智慧集與一體的新技術,可以自動地把文字和其他信息分離出來,通過智慧型識別後輸入計算機,用於代替人工的輸入。文字識別技術可以將紙質的文檔轉換為電子文檔,如銀行票據、文稿、各類公式和符號等自動錄入,可以提供文字的處理效率,有助於查詢、修改、保存和傳播。文字識別方法主要有結構統計模式識別、
結構模式識別和
人工神經網路。由於文字的數量龐大、結構複雜、字型字形變化多樣,使得文字識別技術的研究遇到一定的阻礙。