圖像簡介
數字圖像從獲取到分割前的所有處理都可以統稱為預處理。經過預處理後的圖像在亮度、對比度、清晰度、幾何位置等方面都能達到良好的效果,然後進一步進行圖像分割,把感興趣的目標和背景分割開,最後對分割出來的目標進行分類描述,建立特徵庫,進行進一步的分類識別。並根據輸出的結果去驅動執行機構.這就是圖像處理在工業領域的最終套用。
圖像的描述是對圖像各組成部分的性質和彼此之間關係的描述。區域描述是在圖像中感興趣的區域被分割出來後,對各個分割區域特點的描述,如形狀、凹凸度等,關係描述則是研究把這些區域組織為一個有意義的結構。為了讓計算機有效地識別分割出來的目標,有必要對各區域、邊界的屬性和相關關係用簡潔明確的數值和符號進行表示,這樣在保留原圖像或圖像區域重要信息的同時,能進一步減少描述區域的數據量。這些從原始圖像中產生的數值、符號或者形狀稱為圖像的特徵,它們反映了原圖像最重要的信息和主要特徵。把這些表征圖像特徵的一系列符號稱為描繪子,描繪子具有如下特點:
(1)唯一性:每個目標必須有唯一的表示,否則無法區分。
(2)完整性:描述是明確的,沒有歧義的。
(3)幾何變換不變性:描述應具有平移、旋轉、尺度等幾何變換不變性。
(4)敏感性:描述結果應該具有對相似目標加以區別的能力。
(5)抽象性:從分割區域、邊界中抽取反映目標特性的本質特徵,不容易因噪聲等原I列而發生變化。
結合圖像的特點,下面主要介紹一下圖像的幾何特徵和一些常用的圖像描述方法,包括時圖像邊界的描述、區域的描述、矩描述、紋理描述等,根據不同圖像的特點選擇適當的描述方法,並將其有機地結合起來。
圖像標識
圖像標識是圖像描述的前提條件。圖像經過分割後,一般得到若干個邊界和目標區域,為了能夠從中識別出目標,將它們提取出來,就需要對圖像進行標識。好的圖像標識應在儘可能區別不同目標的基礎上對目標的尺度、平移、旋轉等不敏感。
圖像標識的一種常見方法是對每個區域標註一個唯一的數字,一般為整數。獲取最大整數之後即可方便得出圖像中區域的數目。另一種常見方法是使用較少數目的標號,保證兩個相鄰區域不存在柑同編號即可。但是這種方法必須將區域相關像素的信息加到描述中。
標識算法的輸入一般為二值圖像或多亮度級別的圖像,其中背景可用零值像素表示,目標則用非零像素表示。下面介紹一種實用的4鄰域標記算法和8鄰域標記算法。
(1)第一遍掃描:按從左到右,從上而下的順序搜尋整個圖像A,對每個非零像素點A(i,j)賦予一個非零值b,根據鄰域像素點的標號來選擇b的值。鄰域可參見下圖。
如果所有的鄰域像素值都為0,則賦予A(i,j)一個新的標號。
如果鄰域中僅有一個非零標號或是全部非零標號相同,那么將這個標號賦予A(i,j)。
如果鄰域中存在不同的非零標號(標號衝突),將這個標號對保存在等價表中。
(2)第二遍掃描:由於標號衝突,一些區域存在不同標號的像素。重新掃描圖像,使用等價表的信息標註像素(一般選擇等價對中的最小值)。
4鄰域標記算法與8鄰域標記算法基本相同,鄰域的形狀如上圖所示。下面給出一個使用4鄰域標記算法的例子,如下圖所示。
圖像描述基礎
表示區域涉及到兩個基本選擇:(1)用外部特徵(區域的邊界)表示區域;(2)用內部特徵(組成區域的像素)表示區域。然而,選擇一種表示方案僅僅是使數據更適宜於計算機處理的任務的一部分。下一個任務是在選擇了表示方案的基礎上描述區域。例如,區域可以用邊界來表示,而邊界可以用諸如邊界長度和其包含的凹面象徵的數目等特徵來描述。
圖像描述方法
(1)曲線擬合的實現;
(2)鏈碼:包括歸一化鏈碼和一級差分鏈碼;
(3)基於弧長極半徑的傅立葉描述子。
(4)矩描述:實現HU不變矩的計算。
靜態圖像描述
點陣圖與矢量圖
點陣圖(又稱像素圖或點陣圖像)是由許多小柵格(即像素)組成的,處理點陣圖時,實際上是編輯像素而不是圖像本身。像素是組成圖像的最小單元,每個像素的大小是由圖像的解析度決定的,圖像解析度越高,單位長度上的像素點就越多,每個像素點就越小。每個像素點的位置、色彩、亮度不同,組合在一起形成規則的點陣結構,就組成了圖案。
矢量圖是用直線、曲線等幾何形狀來記錄和表現圖形信息的。使用矢量圖最大的好處是任意縮放圖像和以任意解析度的設備輸出圖像時,都不會影響圖像的品質,也就是說,矢量圖的質量不受解析度高低的影響。其優點在於可以對圖中的每個部分分別進行控制,在螢幕上移動每個部分以及將之壓縮、放大、扭轉和旋轉均不會破壞畫面。
圖像解析度
解析度是和圖像的細節表現能力相關的重要概念,解析度一般指單位長度內的像素數量。圖像解析度越高,圖像畫面的質量越好,對應的圖像檔案大小越大,圖像細節的表現越豐富。
圖像解析度是針對點陣圖而言的,矢量圖是不存在解析度的。
像素
像素是構成數字圖像的基本單元。
像素的顏色深度用來衡量像素中顏色信息的多少,又被稱為位深度。顏色深度用每個像素點上顏色的數據位數(bit)來表示。例如8位顏色深度可以表示256(28)種顏色值,一位的顏色深度可以表示黑、白兩種顏色。
常用的圖像的檔案格式
BMP格式是一種與硬體設備無關的圖像檔案格式,它採用位映射存儲格式,檔案所占用的空間很大。檔案存儲數據時,圖像的掃描方式是從左到右、從下到上的順序。
TIFF格式靈活易變,它定義了4類不同的格式。TIFF-B適用於二值圖像:TIFF-G適用於黑白灰度圖像;TIFF-P適用於帶淵色板的彩色圖像;TIFF-R適用於RGB真彩圖像。
GIF格式採用LZW壓縮算法來存儲圖像數據,並採用了可變長度等壓縮算法。GIF的圖像深度為1~8.也即GIF最多支持256種顏色的圖像。GIF格式的另一個特點是其在一個GIF檔案中可以存多幅彩色圖像,如果把存於一個檔案中的多幅圖像數據逐幅讀出並顯示到螢幕上,就可構成一種最簡單的動畫。
JPEG格式採用對稱的壓縮算法,也即在同一系統環境下壓縮和解壓縮所用的時間相同。採用JPEG壓縮編碼算法壓縮的圖像,其壓縮比為1:5~1:50,甚至更高。
PSD格式是Photoshop的固有格式,PSD格式可以比其他格式更快速地打開和保存圖像,很好地保存圖層、通道、路徑、蒙版,以及壓縮方案不會導致數據丟失等。用PSD格式保存圖像時,圖像沒有經過壓縮,當圖層較多時,會占很大的硬碟空間。
動態圖像描述
動態圖像包括動畫和視頻信息,是連續漸變的靜態圖像或圖形序列,沿時間軸順次更換顯示,從而構成運動視感的媒體。當序列中每幀圖像是由人工或計算機產生的圖像時,通常稱做動畫;當序列中每幀圖像是通過實時攝取的自然景象或活動對象時,稱為影像視頻,或簡稱視頻。
視頻技術包括視頻數位化和視頻編碼技術兩個方面。視頻數位化是將模擬視頻信號經模數轉換和彩色空間變換轉為計算機可處理的數位訊號,使得計算機可以顯示和處理視頻信號。視頻編碼技術是將數位化的視頻信號經過編碼成為電視信號,從而可以錄製到錄像帶中或在電視上播放。對於不同的套用環境有不同的技術可以採用。從低檔的遊戲機到電視台廣播級的編碼技術都已成熟。常見的視頻檔案格式如下表所示。
圖像描述套用
當我們對形狀特徵表示感興趣時,可以選擇外部表示;當我們的主要注意力集中於區域屬性時,可以選擇內部表示,如顏色和紋理。有時可用這兩種表示來解決同一問題。無論是哪一種情況,被選擇描繪子的特徵應該儘可能對區域大小、平移與旋轉的變化不敏感。在很大程度上,描述子滿足一個或者多個這樣的屬性。