概述
模式識別的定義
根據對某個物理對象的觀測信息,利用
計算機對該物理對象進行分類,從而給出該物理對象所屬的類別。在這裡,“模式”就是指
存儲於計算機內的有關物理對象的觀測信息,它可以是圖像、聲音、溫度、壓力等任何可以測量的觀測量。為了讓機器自動完成模式識別任務,我們需要
數據採集設備和
模式識別算法。
模式識別研究的意義
對外界事物的感知與識別是
智慧型的基礎。如果我們能夠很好的解決模式識別問題,就能夠製造出更高級的智慧型系統。一個例子是手寫體識別。另一個例子是自動駕駛系統。模式識別在計算機學科中的地位:模式識別是計算機科學與控制科學的一個交叉學科,是智慧型系統及智慧型信息處理的一個重要基礎。
用於大規模模式識別問題的神經網路算法
概述
許多實際的模式識別問題如對手寫體漢字的識別, 都屬於大規模的模式識別問題。目前,傳統的
神經網路算法對這類問題尚無有效的解決辦法。在球鄰域模型的基礎上提出一種可用於大規模模式識別問題的神經網路
訓練算法,試圖加強神經網路解決大規模問題的能力,並用手寫體漢字識別問題檢驗其效果。實驗結果揭示了所
提算法是解決大規模模式識別問題的一個有效且具有良好前景的方法。
神經網路發展至今,由於其
並行和
容錯等特點,在很多方面,尤其是在模式識別領域已經表現出一定的優勢和潛力。然而,隨著研究的深入,人們已經逐漸認識到就目前情況來看,神經網路尚不能有效解決大規模的模式識別問題。大規模的模式識別問題是指問題的特徵空間維數高,
樣本數量大而且類別多。像手寫體漢字識別、 漢語的音節識別等許多實際問題都是這類問題的典型代表,因此,解決這類問題對於神經網路理論上的完善以及技術上的實用化都具有重要的意義
張鈴等人給出了一種新的M2P神經元的幾何意解釋——球鄰域模型,並在此基礎上提出了多層前向網路的交叉覆蓋設計算法。該算法將神經網路的訓練轉化為幾何的覆蓋問題,思路獨特,而且已經在小規模問題中取得了較好的結果。這裡以球鄰域模型為基礎提出一種新的前饋神經網路訓練算法,並以手寫體漢字為例,進一步研究神經網路處理大規模問題的能力。
用單一的網路同時處理幾千個漢字尚有很多困難,在初步研究階段,較為可行的方法是先將漢字進行粗分類,然後對每個“粗類”中的樣本進一步識別。
算法及其基本思想
模式識別的Bayes決策理論中要求知道樣本的
機率分布,這在實際問題中是很難做到的,所以,在模式識別的統計方法中有許多理論 (如似然法) 都是有關樣本機率分布的估計的,其中許多估計方法都是用形式和數目預先確定的分布函式的
線性組合 (如高斯函式) 去逼近樣本的分布。現有的前饋網路在求解模式識別問題時, 其中心思想是建立樣本和其類別的映射, 然而其訓練方法是基於預先給定的評價函式的極小化,其本質也是用形式和數目預先確定的多個函式 (即隱層單元的輸出函式) 的組合去逼近這一映射。可以看出,這兩種方法都是從已知形式和數目的函式的組合入手來分析,而沒有直接從樣本數據本身入手來推測有關性質。這裡提出的算法就是向這個方向發展的一種初步的嘗試,即直接從樣本數據本身來逼近它在空間中分布的狀況,並以此為依據構造神經網路。該算法用多個MP神經元所對應的多個“球鄰域”去覆蓋各類的所有訓練樣本,由於神經元的有關參數和個數都是直接由訓練樣本通過樣本空間的分布直接決定的,所以該算法出發點不是要得到樣本分布的解析
表達式,而是用這些神經元的覆蓋區域的組合近似“勾勒”出各類樣本分布的幾何區域。而當判斷一個新的樣本應該屬於哪一類時,只需判斷它被哪個幾何區域所覆蓋,該區域所對應的類別就是答案。因此,該算法不要求預先固定隱層單元的個數,這就為神經網路的構造提供了很大的靈活性。
複雜模式識別問題的求解方法
概述
目前,神經網路已在模式識別領域得到了廣泛套用,但對於那些樣本量巨大輸入維數較多的複雜的模式識別問題,直接用神經網路處理時訓練速度往往慢得令人難以忍受,並且存在容易陷入局部極小點造成識別錯誤的問題。
加快訓練速度的一種方法是將龐大的樣本訓練集分成若干個小訓練集,採用並行神經網路分別對小訓練樣本集進行處理。在實用中,當訓練集中的樣本量不大時,在目前的計算機運算速度水平上 即使輸入維數較多,也可以很快完成對樣本集的訓練。因此,問題就轉化為分類和訓練兩個子問題,在這種情況下,單靠一種模型是不能取得很好效果的,必須針對不同的子問題,選擇最適合於解決該問題的模型。因此,對於複雜的問題而言,採用多種模型混合的方法是一條更有效的途徑。這裡引入了串-並行混合結構的多種神經網路模型,該模型不對輸入模式進行預處理,而是直接通過
串列分類神經網路將大樣本集分成幾類,以減小訓練集中的樣本規模,再用並行神經網路對每一類的小樣本集進行訓練。
串-並行混合的多種神經網路模型
考慮到人腦在進行判斷時既具有高度的並行性,同時也有這樣的特點,先根據樣本的主要特徵將其分成若干大類,然後在大類中再根據其它特徵進行識別和判斷。我們將這種思想融入已具有並行性的神經網路中,提出了串-並行混合的多種神經網路模型。
這個網路結構共分為兩部分:串列部分和並行部分。串列部分由分類網路(CNN)實現對輸入樣本的分類,並行部分為多個並行執行的識別網路(RNN) 每個識別網路完成一類樣本的處理,加快處理速度。
系統的輸入是未經
預處理的模式輸入參數,如對16x16的漢字,則直接輸入值為 或 0 1的256個點陣,以避開特徵抽取的難點,並提高處理速度。
分類網路的目的是將所有樣本分類。因為樣本集非常龐大,且隨時都可能出現新的模式需要歸類,BP網顯然力不從心,而ART網表現了其在這方面的良好的效率和性能,並且可根據總樣本集的大小和識別難度通過警戒參數來控制分類結果,因此這裡採用ART1作為分類網路。
識別網路的任務是在屬於同一類的模式中進行更細的分類,由於每一類別中的模式數目已經不是很多,BP網訓練速度的劣勢已不是很明顯,而其可進行非常細緻的分類的優點遠非
ART所能及。因此模型中選用BP網作為識別網路。