近鄰法分類

近鄰法分類,對被識別樣本某個給定近鄰域中的已知類別的學習樣本數量進行統計,並以其中數量最多的那一類作為分類結果的分類方法。

基本介紹

  • 中文名:近鄰法分類
  • 外文名:Nearest neighbor classification
  • 屬性:分類方法
  • 特點:誤識率(錯分率)地
對 k個被識別樣本的近鄰學習樣本進行計算時,假設離被識別樣本最近的5個學習樣本中有3個屬於某類,就把被識別樣本判別為該類。當k等於1時,就是通常所說的最近鄰規則,即被識別樣本離哪一類的學習樣本最近,就把它分到哪一類(見最小距離分類)。設R1,R2…,R0分別是已知類別的c個學習樣本集合,每個集合Rj中有uj個特徵向量,用x忋表示,k=1,2,…,uj。在用最近鄰規則時,可以定義被識別特徵向量y與Rj之間的距離為
近鄰法分類
式中‖·‖是給定的一種距離度量。分類器把被識別模式分類到d(y, Rj)值最小的那一類中去。當用歐氏距離作為距離度量時,可以證明這種方法實質上是一種分段線性分類器。理論分析表明,當學習樣本無限增加時,用最近鄰規則分類的結果,其誤識率(錯分率)不會超過貝葉斯分類器誤識率的兩倍。

相關詞條

熱門詞條

聯絡我們