線上模式分析與識別系統:簡介,機器學習,遷移學習,深度學習,套用,地震預測,人臉識

線上模式分析與識別系統是指對研究的對象採取線上學習或實時控制的方式，能夠對對新到來的數據馬上採用有關算法進行分析，並通過有關技術來識別對象的系統。線上模式分析與識別系統能夠及時地作出分析與識別，增強了系統的實用性。

基本介紹

中文名：線上模式分析與識別系統
外文名：Online pattern analysis and recognition system
學科：計算機
特點：實用性、適應性強
有關術語：實時控制
領域：人工智慧

簡介,機器學習,遷移學習,深度學習,套用,地震預測,人臉識別,

簡介

線上模式分析與識別系統簡單來說實在採用線上學習或實時控制方式，利用模式識別、機器學習、深度學習等技術來實時分析和識別對象的系統。線上模式分析與識別系統與一般的分析與識別系統相比，線上模式分析與識別系統適應能力更強，即具有較強遷移學習能力，能根據對象變化及時修改模型和有關參數。線上模式分析與識別系統在很多領域都有套用，例如股票預測、天氣預測、地震預測、人臉識別、病毒檢測。

機器學習

機器學習（Machine Learning）是研究如何使用計算機模擬或實現人類的學習活動。它是繼專家系統之後人工智慧的又一重要套用領域，是使計算機具有智慧型的根本途徑，也是人工智慧研究的核心課題之一，它的套用遍及人工智慧的各個領域。學習是人類智慧型的重要特徵，是獲得知識的基本手段，而機器學習也是使計算機具有智慧型的根本途徑，如香克所說： “一台計算機若不會學習，就不能稱為具有智慧型的。 ”除此之外，機器學習還有助於發現人類學習的機理和揭示人腦的奧秘。學習是一個有特定目的的知識獲取過程，它的內部主要表現為新知識結構的不斷建立和修改，外部表現為性能的改善。一個學習過程本質上講，就是學習系統把導師（或專家）提供的信息轉換成能被系統理解並套用的形式的過程。按照系統對導師的依賴程度可將學習方法分類為：機械式學習（Rotelearning）、講授式學習（Learning from instruction）、類比學習（Learning by analogy）、歸納學習（Learning from induction）、觀察發現式學習（learning by observation and discovery）等。

遷移學習

在傳統分類學習中，為了保證訓練得到的分類模型具有準確性和高可靠性，都有兩個基本的假設：(1) 用於學習的訓練樣本與新的測試樣本滿足獨立同分布的條件；(2) 必須有足夠可利用的訓練樣本才能學習得到一個好的分類模型。但是，在實際套用中我們發現這兩個條件往往無法滿足。首先，隨著時間的推移，原先可利用的有標籤的樣本數據可能變得不可用，與新來的測試樣本的分布產生語義、分布上的缺口。比如，股票數據就是很有時效性的數據，利用上月份的訓練樣本學習得到的模型並不能很好地預測本月份的新樣本。另外，有標籤的樣本數據往往很缺乏，而且很難獲得。在 Web 數據挖掘領域，新數據不斷湧現，已有的訓練樣本已經不足以訓練得到一個可靠的分類模型，而標註大量的樣本又非常費時費力，而且由於人的主觀因素容易出錯。這就引出了機器學習中另外一個重要問題，如何利用少量的有標籤訓練樣本或者源領域數據，建立一個可靠的模型，對目標領域數據進行預測（源領域數據和目標領域數據可以不具有相同的數據分布）。何清等人[1]指出數據分類首先要解決訓練集樣本抽樣問題，如何抽到具有代表性的樣本集作為訓練集是一個值得研究的重要問題。

近年來，遷移學習已經引起了廣泛的關注和研究。遷移學習是運用已存有的知識對不同但相關領域問題進行求解的新的一種機器學習方法。它放寬了傳統機器學習中的兩個基本假設，目的是遷移已有的知識來解決目標領域中僅有少量或甚至沒有有標籤樣本數據時的學習問題。遷移學習廣泛存在於人類的活動中。兩個不同的領域共享的因素越多，遷移學習就越容易，否則就越困難，甚至出現“負遷移”，產生副作用。比如：一個人要是學會了騎腳踏車，那他就很容易學會開機車；一個人要是熟悉五子棋，也可以輕鬆地將知識遷移到學習圍棋中。針對源領域和目標領域樣本是否標註以及任務是否相同，可以把以往遷移學習工作劃分為歸納遷移學習、直推式遷移學習以及無監督遷移學習等。而按照遷移學習方法採用的技術劃分，又可以把遷移學習方法方面的工作大體上分為：i) 基於特徵選擇的遷移學習算法研究；ii) 基於特徵映射的遷移學習算法研究；iii) 基於權重的遷移學習算法研究。

深度學習

許多研究表明，為了能夠學習表示高階抽象概念的複雜函式，解決目標識別、語音感知和語言理解等人工智慧相關的任務，需要引入深度學習( deep learning)。深度學習架構由多層非線性運算單元組成，每個較低層的輸出作為更高層的輸入，可以從大量輸入數據中學習有效的特徵表示，學習到的高階表示中包含輸入數據的許多結構信息，是一種從數據中提取表示的好方法，能夠用於分類、回歸和信息檢索等特定問題中。深度學習的概念起源於人工神經網路的研究，有多個隱層的多層感知器是深度學習模型的一個很好的範例。對神經網路而言，深度指的是網路學習得到的函式中非線性運算組合水平的數量。當前神經網路的學習算法多是針對較低水平的網路結構，將這種網路稱為淺結構神經網路，如一個輸入層、一個隱層和一個輸出層的神經網路；與此相反，將非線性運算組合水平較高的網路稱為深度結構神經網路，如一個輸入層、三個隱層和一個輸出層的神經網路。深度學習與淺學習相比具有許多優點，說明了引入深度學習的必要性：

a)在網路表達複雜目標函式的能力方面，淺結構神經網路有時無法很好地實現高變函式等複雜高維函式的表示，而用深度結構神經網路能夠較好地表征。

b)在網路結構的計算複雜度方面，當用深度為 k 的網路結構能夠緊湊地表達某一函式時，在採用深度小於 k 的網路結構表達該函式時，可能需要增加指數級規模數量的計算因子，大大增加了計算的複雜度。另外，需要利用訓練樣本對計算因子中的參數值進行調整，當一個網路結構的訓練樣本數量有限而計算因子數量增加時，其泛化能力會變得很差。

c)在仿生學角度方面，深度學習網路結構是對人類大腦皮層的最好模擬。與大腦皮層一樣，深度學習對輸入數據的處理是分層進行的，用每一層神經網路提取原始數據不同水平的特徵。

d) 在信息共享方面，深度學習獲得的多重水平的提取特徵可以在類似的不同任務中重複使用，相當於對任務求解提供了一些無監督的數據，可以獲得更多的有用信息。

套用

地震預測

地震預測是預測一次地震發生的時間、地點和規模。地震學家目前仍無法預測地震的確切發生時間，然而對地下構造了解的進步，科學家能透過震災危害度評估，提供特定規模的地震在未來數年到數十年之間，發生在某區域的機率，以供建築物和公共建設設定最低防震規範。雖然部分證據表明，對某些區域的地震預報或許有實用價值，然而這些技術的可靠性既未確立，也無法重製，所以地震學家及地質學家一般認為實用的地震預測還是夢想。

人臉識別

人臉識別，特指利用分析比較人臉視覺特徵信息進行身份鑑別的計算機技術。廣義的人臉識別實際包括構建人臉識別系統的一系列相關技術，包括人臉圖像採集、人臉定位、人臉識別預處理、身份確認以及身份查找等；而狹義的人臉識別特指通過人臉進行身份確認或者身份查找的技術或系統。人臉識別是一項熱門的計算機技術研究領域，它屬於生物特徵識別技術，是對生物體（一般特指人）本身的生物特徵來區分生物體個體。生物特徵識別技術所研究的生物特徵包括臉、指紋、手掌紋、虹膜、視網膜、聲音（語音）、體形、個人習慣（例如敲擊鍵盤的力度和頻率、簽字）等，相應的識別技術就有人臉識別、指紋識別、掌紋識別、虹膜識別、視網膜識別、語音識別（用語音識別可以進行身份識別，也可以進行語音內容的識別，只有前者屬於生物特徵識別技術）、體形識別、鍵盤敲擊識別、簽字識別等。

線上模式分析與識別系統