監督分類

監督分類

監督分類又稱訓練場地法、訓練分類法,是以建立統計識別函式為理論基礎、依據典型樣本訓練方法進行分類的技術,即根據已知訓練區提供的樣本,通過選擇特徵參數,求出特徵參數作為決策規則,建立判別函式以對各待分類影像進行的圖像分類,是模式識別的一種方法。要求訓練區域具有典型性和代表性。判別準則若滿足分類精度要求,則此準則成立;反之,需重新建立分類的決策規則,直至滿足分類精度要求為止。

基本介紹

  • 中文名:監督分類
  • 外文名:Supervised Classification
  • 適用學科:遙感原理與套用
  • 運用領域:測繪科學與技術
定義,樣本和統計,分類算法,特點,

定義

監督分類是遙感圖像分類的一種,即用被確認類別的樣本像元去識別其他未知類別像元的過程。已被確認類別的樣本像元是指那些位於訓練區的像元。在這種分類中,分析者在圖像上對每一種類別選取一定數量的訓練區,計算機計算每種訓練樣區的統計或其他信息,每個像元和訓練樣本作比較,按照不同規則將其劃分到和其最相似的樣本類。監督分類可分兩個基本步驟:選擇訓練樣本和提取統計信息,以及選擇分類算法。

樣本和統計

訓練樣本的選擇需要分析者對待分類圖像所在區域有所了解,或進行過初步的野外調查,或研究過有關圖件和高精度的航空照片。其最終選擇的訓練樣本應能準確地代表整個區域內每個類別的光譜特徵差異。顯然,訓練樣本的選擇時監督分類的關鍵。因此,同一類別的訓練樣本必須是均質的,不能包含其他類別,也不能是和其他類別之間的邊界或混合像元;其大小、形狀和位置必須能同時在圖像和實地(或其他參考圖)容易識別和定位。
在選擇訓練樣本時,還必須考慮每一類別訓練樣本的總數量。作為一個普遍的規則,如果圖像有N波段,則每一類別至少應該有10N個訓練樣本,才能滿足一些分類算法中計算方差和協方差矩陣的要求。總的樣本數量應根據區域異質程度而有所不同。
訓練樣本的來源可以有以下幾種:
①實地收集,即通過GPS定位而實地記錄的樣本;
②螢幕選擇,利用先驗知識直接從圖像中提取訓練數據的做法比較普遍與合理。
選擇訓練樣本後,為了比較與評價樣本好壞,需要計算各類別訓練樣本的基本光譜特徵信息,通過每個樣本的基本統計值(如均值、標準方差、最大值、最小值、方差、協方差矩陣、相關矩陣等),檢查訓練樣本的代表性,評價樣本好壞,選擇合適波段。評價訓練樣本的方法有兩種:圖表顯示和統計測量。
圖表顯示是將訓練樣本的直方圖、均值、方差、最大值及最小值繪製成線狀、散狀等圖,目視評價各類別訓練樣本的分布、離散度和相關性,例如均值圖、直方圖、特徵空間二維圖等。
統計測量是利用統計方法來定量衡量訓練樣本之間的分離度。對於任何一個多波段圖像,我們總希望用最少的波段來區分不同類別,從而達到最高分類精度。通常對於訓練樣本,要按照一定決策規則檢查兩種類型的誤差:①錯分誤差,即像元被分到一個錯誤的類別;②漏分誤差,即像元沒有被分到其對應的類別。
對於不同的套用環境,監督分類中訓練樣本的選擇及對其統計評價的步驟和方法都會有所不同,基本操作過程為:
(1)收集有關分類區的信息,以了解該區主要分類類別及分布狀況;
(2)對圖像進行檢查,對照已有參考數據或實地考察,評價圖像質量,檢查其直方圖,決定是否需要別的預處理,並確定其分類系統;
(3)在圖像上對每一類按照上文提到的標準選擇訓練樣本,其必須是容易識別的,均勻分布於全圖;
(4)對每一類別的訓練樣本,檢查顯示其直方圖,計算、檢查其均值、方差、協方差矩陣,以及其對應的特徵空間相關波譜橢圓形圖和指示其分離度的不同統計指數等,從而評估其訓練樣本的有效性;
(5)根據(4)中的檢查和評估,修改訓練樣本,必要時重新選擇和評估訓練樣本;
(6)將訓練樣本信息運用於合適的分類過程中。

分類算法

常用的監督分類算法有以下幾種:
(1)平行算法
又稱盒式決策規則,是根據訓練樣本的亮度值範圍形成一個多維數據空間。其他像元的光譜值如果落在訓練樣本的亮度值所對應的區域,就被劃分到其對應的類別中。這種算法簡明、直接,能將大多數像元劃分到一個類別。缺點是當類別較多時,各類別所定義的區域容易重疊。
(2)平行六面體法
平行六面體將用一條簡單的判定規則對多光譜數據進行分類。判定邊界在影像數據空間中是否行成了一個N維的平行六面體。平行六面體的尺度是由標準差閾值所確定的,而該標準差閾值則是根據每種所選類的均值求出的。
(3)最大似然法
在多類地物識別時,常採用某種統計方法建立起一個判別函式集,然後根據這個判別函式計算各待分類樣本的歸屬機率,樣本屬於哪一類的機率最大就判別其屬於哪一類,這就是最大似然法。最大似然法是根據訓練樣本的均值和方差來評價其他像元和訓練類別之間的相似性,它可以同時定量地考慮兩個以上的波段和類別,是一種廣泛套用的分類器,但是這種算法的計算量較大,同時對不同類別的方差變化比較敏感。
(4)最小距離法
最小距離法是一種原理簡單,套用方便的分類方法,它利用訓練樣本中各類別在各波段的均值,根據各像元離訓練樣本平均值的距離大小來決定其類別,其在遙感分類中套用並不廣泛,主要缺點是此方法沒有考慮不同類別內部方差的不同,從而造成一些類別在其邊界上的重疊,引起分類誤差,因此需要一些更有效的測量距離的方法。
(5)馬氏距離法
是一個方向靈敏的距離分類器,分類時將使用到統計信息,與最大似然法有些類似,但是她假定了所有類的協方差都相等,所以它是一種較快的分類方法。
(6)二值編碼分類法
根據波段值落在均值的上或下方,把數據波譜和端元波譜編碼為0或1,異或邏輯函式用來將每種編碼後的參考波譜同編碼後的數據波譜進行比較,生成一副分類影像。
(7)波譜角填圖分類法
是一個基於物理的波譜分類法,它是用N維角度將像元與參考波譜進行匹配,此方法將波譜看成是空間中的矢量,矢量的維數就等於波段的個數,通過計算波譜間的角度,來判斷波譜間的相似程度
(8)費歇爾線性判別法
費歇爾線性判別法是一種套用廣泛,具有較高判別能力的多元邏輯機率判別方法,基於費歇爾線性判別法,結合實際數據,構建了高校財務風險判別指標體系、建立了費歇爾線性判別模型,並進行實證檢驗。

特點

監督分類的主要優點如下:
(1)可根據套用目的和區域,充分利用先驗知識,有選擇地決定分類類別,避免出現不必要的類別;
(2)可控制訓練樣本的選擇;
(3)可通過反覆檢驗訓練樣本,來提高分類精度,避免分類嚴重錯誤;
(4)避免了非監督分類中對光譜集群組的重新歸類。
缺點如下:
(1)其分類系統的確定、訓練樣本的選擇,均人為主觀因素較強,分析者定義的類別有可能並不是圖像中存在的自然類別,導致各類別間可能出現重疊;分析者所選擇的訓練樣本也可能並不代表圖像中的真實情形;
(2)由於圖像中同一類別的光譜差異,造成訓練樣本沒有很好的代表性;
(3)訓練樣本的選取和評估需花費較多的人力、時間;
(4)只能識別訓練樣本中所定義的類別,若某類別由於訓練者不知道或者其數量太少未被定義,則監督分類不能識別。

相關詞條

熱門詞條

聯絡我們