自適應模式識別處理

自適應模式識別處理

自適應模式識別系統是將自適應系統與模式識別相結合,這種系統基於自適應N元方法,可採用RAM網路實現,其識別能力是基於在網路“學習”後而在網中形成的邏輯函式來實現的。

基本介紹

  • 中文名:自適應模式識別處理
  • 外文名:Adaptive Pattern Recognition Processing
  • 簡稱:APRP
  • 學科:控制科學與工程
  • 基本釋義:自適應系統與模式識別相結合
  • 基礎:自適應N元方法
概念定義,一般結構,模擬實現,最佳化方向技術,

概念定義

模式識別技術起源於六十年代,近三十多年裡發展迅猛,取得了很大成就,在醫學診斷、臉譜識別、偽幣識別、工業色譜成分分析等各方面日益顯示出其巨大作用。傳統的模式識別方法,如:模板匹配法、判別函式法、句法分析法等,雖然比較簡單,但它們都存在著不可克服的缺點,即:要求預先確定分類算法,而且要利用先驗知識去描述各模式類的特徵。因而採用這種識別方法的模式識別系統缺乏靈活性和通用性。
自適應模式識別系統是將自適應系統與模式識別相結合,這種系統基於自適應N元方法,可採用RAM網路實現,其識別能力是基於在網路“學習”後而在網中形成的邏輯函式來實現的。

一般結構

首先介紹用作“學習”及識別模式的RAM。這樣的RAM有兩種工作方式,即寫/讀方式:
(1)寫工作方式:此時激活RAM的寫使能端,且數據入口端接高電平,則此時被輸入地址譯中的觸發器單元置位。
(2)讀工作方式:此時使寫使能端無效,對應任何一個輸入地址,將在數據出口處輸出其所對應譯中單元的內容。
任何一個分類器都是由若干個RAM構成的。我們設輸入空間的大小是3x3,按下列輸入映射方式將它分成三個子模式,每個子模式分別接到一個RAM片的地址輸入端。
假定該分類器可識別“T”形狀的輸入模式,則首先我們須對它進行訓練,即:用“T”模式類的代表模式集訓練分類器,讓它“學習”,此時各RAM應工作在寫方式下。訓練結束後,則會在各RAM中形成相應的模式類的各子模式的邏輯函式,從而在整個分類器中建立起對應的模式類的邏輯函式。而後,系統就進入分類工作方式,利用在分類器中建立的邏輯函式對各未知輸入模式進行回響、分類。

模擬實現

系統在訓練過程中,對應於一個模式類,可採用多個子模式集合代替相應的RAM去存放“學習”到的知識—邏輯函式。訓練結束後,則每個分類器對應著多個集合。
系統分類時,仍採用訓練時的邏輯映射法將輸入未知模式邏輯地分成子模式。對每個分類器,都按以下算法處理:
(1)對輸入子模式,分別求出它與該分類器的相應子模式集合中每個子模式的海明距離,然後取其最小值。
(2)對輸入模式的所有子模式,重複(1),求得各最小值,將其求和,即可得知該分類器對未知輸入模式的回響值。
對所有分類器,都按上述算法處理,然後由決策邏輯得出分類結果。

最佳化方向技術

訓練數據的最佳化
用於訓練分類器的訓練數據決定了系統的推廣性質,對整個系統識別功能是極為重要的。
訓練集分布較密,則其推廣集相應較小;而若訓練集分散過大,則會使被訓練的分類器有過大的推廣集,從而可能對根本與該類無關的輸入模式也發出一個很高回響。
一般,人們能注意不選分散性太大的訓練模式去訓練分類器,因而我們考慮分布較稠密的訓練模式的最佳化問題,即尋找最適訓練集,這可以由以下過程去實現:用模式類中的一個參考集中的一個成員(模式)去訓練分類器,訓練結束後再讓該分類器對剩下的其它成員分類,輸出回響,把得到最低回響的對應成員(模式)加入訓練集去訓練分類器,反覆上述過程,就可得到一個可靠的訓練集。因為那些發出較高回響的成員顯然不會對分類器提供另外的新“知識”了,則將被留在參考集中而不作為訓練模式使用。
加權技術的影響
由於各種噪聲及其它人為因素干擾,會使一些輸入的訓練模式中含有偽特徵,從而使整個模式識別系統的識別性能明顯下降。
一般的自適應模式識別系統中,各RAM單元口簡單記錄對應的子模式狀態是否出現過,只要出現過1次就置位,認為是固有特徵,這樣使得許多偽特徵被誤認為是對應模式的子模式特徵。
經驗告訴我們:干擾形成的偽特徵出現的頻率遠小於對應模式的固有特徵出現頻率。
於是,可以對各子模式狀態出現的頻率計數統計。訓練結束後,將在各RAM單元存放對應子模式狀態出現的頻率,而不是以“1”簡單地表示它出現過。然後將各RAM單元的大小與標準頻率比較,大於標準則置“1",否則置“0",置“1”表示該單元所對應的子模式特徵確是固有特徵,置“0”則表示該對應特徵是偽特徵,因而去除之。
一句話,加權訓練後,在分類器中形成的邏輯函式實際上是建立在對各特徵出現頻率統計、閥值基礎之上的,顯然這大大提高了模式識別系統的性能。
上述處理也可在由軟體實現的系統中實現:即訓練時,對每個分類器的甸一個子模式集合中的子模式,分別對其出現頻率進行統計。訓練完後,對統計結果閥值處理,大於標準的留在集合中,反之則從集合中去掉。
最佳化輸入連線映射
(1)去除輸入模式中固定不變點
若輸入模式中的某些點始終是保持為‘1’(或為‘o’)則可以不用將其連在系統的各分類器上。
一個n元子模式中的不變點將會使得與之有關的
個存貯單元有一半(即
)不起作用,即在訓練過程中解碼定址時會有一半的單元將永遠不會被解碼譯中。這樣即使今後在分類時,在此不變位置上產生了變化輸入,則由於各分類器對應此單元的內容一樣而不會對分類結果有影響,所以可以去除輸入模式中固定不變點,節省記憶體單元,且也對分類起積極作用。
在軟體實現的識別系統中,也可實現這一最佳化過程,但是這樣做就沒有節省記憶體的優點,因而一般可不做。
(2)去除冗餘特徵
在低可分性的類別之間分類時,可去掉這些類之間的較多的共同n元子模式特徵,因為這些特徵對於模式分類無任何作用,即為冗餘特徵。
例如,字母“I”,與“T”,字母模式類之間,顯然第一個子模式特徵就屬於冗餘特徵。在訓練結束後,通過清除各分類器中對應此子模式的單元即可去掉冗餘。
在軟體實現的識別系統中,要消除冗餘很簡單,只需在訓練完成後分別去掉各分類器中冗餘的子模式集就可以實現了。
關於輸入映射最佳化的一個最典型的例子是臉部表情的識別問題。在開始時分別對兩個分類器進行訓練,使之能分別識別人的面部笑的表情和嚴肅的表情。這時,在人整個面部表情作為一個整體的輸入模式中,顯然有一些子模式是有價值的(例如嘴部表情和眼部表情等,約占整個模式的三分之一),它們能提供兩種表情的差異之處;而有一些子模式對今後分類處理無任何作用,它們在兩種表情下始終保持不變。這樣,通過上述的輸入連線映射的最佳化方法,即對不變的輸入模式點不進行連線或在訓練完成之後刪除相應的冗餘n元子模式,可節省約2/3的記憶體空間,而且同時可使辨識精度提高50%以上。
在實際生產過程中,例如在產品質量檢測中,也可利用這一最佳化方法,即只對產品可能出現質量問題的部分進行辨識和處理,既能加快識別速度,又能提高準確率。
使用這種方法,會使分類器對特定間題的識別分類能力大大提高,並節省大量記憶體空間。但是相對而言它削弱了分類器分類的一般性和通用性性能。尤其是在處理多類識別問題時,實現起來就十分困難了,這時可採用下面介紹的多層識別方法。
多級分類最佳化法
像前面所講的“n元共用”在所有的分類器的訓練集中都出現是不可能的,因而在多類別分類中進行這一最佳化是不現實的。但是,參照實際的分類結果,還是能改進在低可分類別之間的分類的,於是,我們可從另一方面考慮實現這一最佳化,即:多級分類最佳化法。
例如像“0”和“O”,這兩類模式,其差異性很小(海明距離小),共同特徵很多,因而它們訓練後的推廣區域必有很大重疊,這樣,不是大量的“0”和“O”,模式狀態被拒絕分類,就是會錯誤分類。
因此採用兩級分類法,即:在第一級分類時進行粗分,將“0”和“O”分成同一類,而後對這一類再第二次分類,即細分。在第二級分類時,只需考慮字元間的差異區域,即“0”和“O”的輸入模式狀態的右部。
在硬體實現時,可採用多視窗技術,即:對整體“0”和“O”輸入空間進行一次分類,而後將視窗定在輸入空間右部再進行一次分類。
這一切也可以在軟體實現的識別系統中實現:首先將輸入模式按分類算法計算得知是否屬於“0”和“O”特徵類;若屬於則再對之細分,求輸入模式與“0”和“O”特徵集合的右部特徵的海明距離,以此作為回響而最後分類。
反饋最佳化法
增加反饋機構,反饋決策或模式,與輸入模式迭加一起構出網路的輸入空間,從而改善模式識別系統的識別性能。
關於反饋問題,其作法與套用目的很多,其中圖象重建及迫蹤定位的反饋問題,有著很好的適用意義。在一般不具有反饋的系統,對於一個輸入模式,給出的回響僅僅是將它分類到某個模式類別,即將其歸類於與它的差異最小的那個模式類中就完了。加入反饋後,系統則可以不僅判定輸入模式的類別,而且能按反饋系統中已存有的各模式類的原型,將輸入模式重建,使殘缺的圖形能復原為相應模式類的標準圖象,這是一項十分有意義有價值的工作。

相關詞條

熱門詞條

聯絡我們