樹分類器

樹分類器

分類器是需要通過多級判別才能確定模式所屬類別的一種分類方法。多級判別過程可以用樹狀結構表示,所以稱為樹分類器

基本介紹

  • 中文名:樹分類器
  • 外文名:Tree classifier
  • 表示:多級判別過程可以用樹狀結構
  • 屬性:通信術語
  • 相關:類別
分類,相關問題,相關研究,

分類

最常用一類樹分類器,稱為二分樹分類器。例如在對0~9十個數字進行識別時,可以先根據某些特徵把0,6,8,9,4分成一類(C1),把1,2,3,5,7分成一類(C2),然後根據這些特徵或另外一些特徵把0,6,8,9,4這一類再分成0,4,8一類 (C3)和4,6,9一類(C4)等,直到最後把各個數字分開為止(見圖)。這種樹狀結構由節點和樹枝所組成,它的特點是除了樹根C0沒有前級節點(父節點)以外,其餘節點都有父節點(例如C的父節點是C,且所有的節點都可以從樹根沿樹枝所組成的路徑達到。沒有後繼節點(子節點)的節點叫作葉,如C8,C10,C11等,其餘的叫作非終止節點。每個非終止節點都只有兩個子節點的樹分類器,
樹分類器
每個終止節點對應一個類別,為了提高樹分類器的正確識別率,允許有幾個葉對應同一個類別。非終止節點對應的類別是它的子節點所對應的類別的總和。

相關問題

樹分類器的設計需要解決以下幾個問題:
① 確定樹的結構。樹結構影響正確識別率和平均判別次數,一般根據所研究問題的性質確定某種與正確識別率有聯繫的目標函式代替正確識別率,作為判斷結構是否合理的標準,從樹根出發在每個非終止節點尋找使目標函式達到最小(或最大)的子節點和對應的類別配置。
② 對每個非終止節點選擇用於判別的特徵子集,分枝限界算法能提供選擇最佳特徵子集的有效方法。
③ 為每個非終止節點確定判別函式,最常用的判別函式是線性判別函式
由於在每個非終止節點需要判別的類別比較少,在多數情況下,可以用較少的特徵和較簡單的判別函式(因而較少的計算機時間)以達到總體上比較好的分類效果。

相關研究

針對傳統分類方法在處理空間特徵分布極為複雜的數據時效果不佳的缺點,結合“分層思想”的樹分類技術,將廣泛用於數據挖掘模型中的CART決策樹算法套用到遙感影像分類中,具有更好的彈性和魯棒性,且分類結構簡單明了,達到了更好地分類效果。
決策樹算法是數據挖掘中套用最廣的歸納推理算法之一,其構造不需要任何領域知識或參數設定,適合於探測式知識發現。決策樹算法具有結構清晰、運行速度快、準確性高以及更好的靈活性和魯棒性,可以用於處理高維數據,其獲取的知識是直觀的且容易被人理解。決策樹算法已經被廣泛的套用於醫學、製造和生產、金融分析、天文學、分子生物學以及遙感影像分類等領域。
遙感影像分類是進行遙感影像解譯的主要手段之一,其基本思想是通過對遙感影像中各類地物的光譜、空間、幾何、紋理等信息的分析,選擇特徵,利用一定的手段對影像中的每個像素或者是分割對象進行歸類,按照分類對象的不同,可以分為基於像元和面向對象兩種。為了減少人工工作量,提高分類效率,最鄰近、最大似然、支持向量機、模糊聚類、決策樹和神經網路等分類算法作為分類手段被廣泛套用於基於像元的分類方法中,同時在面向對象分類中,也使用了最鄰近、隸屬度函式、支持向量機和決策樹等分類算法。

相關詞條

熱門詞條

聯絡我們