增量特徵識別

增量特徵識別

增量學習(Incremental Learning)是指一個學習系統能不斷地從新樣本中學習新的知識,並能保存大部分以前已經學習到的知識。增量學習非常類似於人類自身的學習模式。增量特徵識別是指利用增量學習進行特徵識別,即不斷地從新樣本進行學習到新的特徵用於一些對象的識別。

基本介紹

  • 中文名:增量特徵識別
  • 外文名:incremental feature recognition
  • 學科:計算機
  • 定義:利用增量學習進行特徵識別
  • 有關術語:增量學習
  • 領域:人工智慧
簡介,增量學習,概述,特點,意義,特徵檢測,套用,生物特徵識別,圖像識別,

簡介

增量特徵識別是指利用增量學習進行特徵識別,即不斷地從新樣本進行學習到新的特徵用於一些對象的識別。在實際中,一個要識別的對象特徵是大量的且不斷變化的,為了提高識別的精確度,就需要不斷地提取新的特徵,增量特徵識別恰巧滿足這一需求。增量特徵識別在實際套用中有著廣泛套用,例如生物特徵識別圖像識別

增量學習

概述

人腦具有漸進學習的能力,研製具有類似人腦學習能力的計算模型一直是機器學習領域的重要分支之一。在實際套用中由於採集樣本的代價或時間等原因,很難一次性獲得全部樣本。實際問題也不允許等到獲取全部樣本後再進行機器學習。因此只能逐步將獲取樣本中包含的知識納入學習系統中,也就是進行增量學習。增量學習(Incremental Learning)是指一個學習系統能不斷地從新樣本中學習新的知識,並能保存大部分以前已經學習到的知識。增量學習非常類似於人類自身的學習模式。
增量學習主要表現在兩個方面:一方面由於其無需保存歷史數據,從而減少存儲空間的占用;另一方面增量學習在當前的樣本訓練中充分利用了歷史的訓練結果,從而顯著地減少了後續訓練的時間。增量學習主要有兩方面的套用:一是用於資料庫非常大的情形,例如Web日誌記錄;二是用於流數據,因為這些數據隨著時間在不斷的變化,例如股票交易數據。另外在增量學習中,現有的增量學習算法大多採用決策樹和神經網路算法實現的,它們在不同程度上具有以下兩方面的缺點:一方面由於缺乏對整個樣本集期望風險的控制,算法易於對訓練數據產生過量匹配;另一方面,由於缺乏對訓練數據有選擇的遺忘淘汰機制,在很大程度上影響了分類精度。

特點

一個增量學習算法應同時具有以下特點:
1)可以從新數據中學習新知識;
2)以前已經處理過的數據不需要重複處理;
3)每次只有一個訓練觀測樣本被看到和學習;
4)學習新知識的同時能保存以前學習到的大部分知識;
5)—旦學習完成後訓練觀測樣本被丟棄;
6)學習系統沒有關於整個訓練樣本的先驗知識;

意義

開展增量學習的研究具有以下兩方面非常重要的意義:
1)隨著資料庫以及網際網路技術的快速發展和廣泛套用,社會各部門積累了海量數據,而且這些數據量每天都在快速增加。如何從這些數據中獲取有用信息以及對數據進行分析和處理是一項艱苦的工作。而傳統的批量學習方式是不能適應這種需求的,只有通過增量學習的方式才能有效解決這種需求。
2)通過對增量學習模型的研究,能夠使我們從系統層面上更好地理解和模仿人腦的學習方式和生物神經網路的構成機制,為開發新計算模型和有效學習算法提供技術基礎。

特徵檢測

特徵檢測是計算機視覺和圖像處理中的一個概念。它指的是使用計算機提取圖像信息,決定每個圖像的點是否屬於一個圖像特徵。特徵檢測的結果是把圖像上的點分為不同的子集,這些子集往往屬於孤立的點、連續的曲線或者連續的區域。
特徵的精確定義往往由問題或者套用類型決定。特徵是一個數字圖像中“有趣”的部分,它是許多計算機圖像分析算法的起點。因此一個算法是否成功往往由它使用和定義的特徵決定。因此特徵檢測最重要的一個特性是“可重複性”:同一場景的不同圖像所提取的特徵應該是相同的。特徵檢測是圖象處理中的一個初級運算,也就是說它是對一個圖像進行的第一個運算處理。它檢查每個像素來確定該像素是否代表一個特徵。假如它是一個更大的算法的一部分,那么這個算法一般只檢查圖像的特徵區域。作為特徵檢測的一個前提運算,輸入圖像一般通過高斯模糊核在尺度空間中被平滑。此後通過局部導數運算來計算圖像的一個或多個特徵。
有時,假如特徵檢測需要許多的計算時間,而可以使用的時間有限制,一個高層次算法可以用來控制特徵檢測階層,這樣僅圖像的部分被用來尋找特徵。由於許多計算機圖像算法使用特徵檢測作為其初級計算步驟,因此有大量特徵檢測算法被發展,其提取的特徵各種各樣,它們的計算複雜性和可重複性也非常不同。

套用

生物特徵識別

生物特徵識別(BIOMETRICS) 技術,是指通過計算機利用人體所固有的生理特徵(指紋、虹膜、面相、DNA等)或行為特徵(步態、擊鍵習慣等)來進行個人身份鑑定的技術。
生物識別技術(Biometric Identification Technology)是指利用人體生物特徵進行身份認證的一種技術。更具體一點,生物特徵識別技術就是通過計算機與光學、聲學、生物感測器和生物統計學原理等高科技手段密切結合,利用人體固有的生理特性和行為特徵來進行個人身份的鑑定。
生物識別系統是對生物特徵進行取樣,提取其唯一的特徵並且轉化成數字代碼,並進一步將這些代碼組合而成的特徵模板。人們同識別系統互動進行身份認證時,識別系統獲取其特徵並與數據可中的特徵模板進行比對,以確定是否匹配,從而決定接受或拒絕該人。在目前的研究與套用領域中,生物特徵識別主要關係到計算機視覺、圖象處理與模式識別、計算機聽覺、語音處理、多感測器技術、虛擬現實、計算機圖形學、可視化技術、計算機輔助設計、智慧型機器人感知系統等其他相關的研究。已被用於生物識別的生物特徵有手形、指紋、臉形、虹膜、視網膜、脈搏、耳廓等,行為特徵有簽字、聲音、按鍵力度等。基於這些特徵,生物特徵識別技術已經在過去的幾年中已取得了長足的進展。

圖像識別

圖像識別,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。一般工業使用中,採用工業相機拍攝圖片,然後再利用軟體根據圖片灰階差做進一步識別處理,圖像識別軟體國外代表的有康耐視等,國內代表的有圖智慧型等。另外在地理學中指將遙感圖像進行分類的技術。

相關詞條

熱門詞條

聯絡我們