手勢識別

手勢識別

在計算機科學中,手勢識別是通過數學算法來識別人類手勢的一個議題。手勢識別可以來自人的身體各部位的運動,但一般是指臉部和手的運動。用戶可以使用簡單的手勢來控制或與設備互動,讓計算機理解人類的行為。其核心技術為手勢分割、手勢分析以及手勢識別。

基本介紹

  • 中文名:手勢識別
  • 外文名:Gesture recognition
  • 方法:通過數學算法來識別人類手勢
  • 隸屬計算機科學
  • 核心技術:分割、分析、識別
簡介,研究發展,手勢識別關鍵技術,手勢分割,手勢分析,手勢識別,展望,

簡介

手勢識別是計算機科學和語言技術中的一個主題,目的是通過數學算法來識別人類手勢。 手勢可以源自任何身體運動或狀態,但通常源自面部或手。 本領域中的當前焦點包括來自面部和手勢識別的情感識別。 用戶可以使用簡單的手勢來控制或與設備互動,而無需接觸他們。姿勢,步態和人類行為的識別也是手勢識別技術的主題。手勢識別可以被視為計算機理解人體語言的方式,從而在機器和人之間搭建比原始文本用戶界面或甚至GUI(圖形用戶界面)更豐富的橋樑。
手勢識別使人們能夠與機器(HMI)進行通信,並且無需任何機械設備即可自然互動。 使用手勢識別的概念,可以將手指指向計算機螢幕,使得游標將相應地移動。 這可能使常規輸入設備(如滑鼠,鍵盤甚至觸控螢幕)變得冗餘。

研究發展

最初的手勢識別主要是利用機器設備,直接檢測手胳膊各關節的角度和空間位置。這些設備多是通過有線技術將計算機系統與用戶相互連線,使用戶的手勢信息完整無誤地傳送至識別系統中,其典型設備如數據手套等。數據手套是由多個感測器件組成,通過這些感測器可將用戶手的位置手指的方向等信息傳送到計算機系統中。數據手套雖可提供良好的檢測效果,但將其套用在常用領域則價格昂貴。其後,光學標記方法取代了數據手套將光學標記戴在人手上,通過紅外線可將人手位置和手指的變化傳送到系統螢幕上,該方法也可提供良好的效果,但仍需較為複雜的設備。
外部設備的介入雖使得手勢識別的準確度和穩定性得以提高,但卻掩蓋了手勢自然的表達方式為此,基於視覺的手勢識別方式應運而生視覺手勢識別是指對視頻採集設備拍攝到的包含手勢的圖像序列,通過計算機視覺技術進行處理,進而對手勢加以識別。

手勢識別關鍵技術

手勢無論是靜態或動態,其識別順序首先需進行圖像的獲取手的檢測和分割手勢的分析,然後進行靜態或動態的手勢識別 。
手勢識別

手勢分割

手勢分割是手勢識別過程中關鍵的一步,手勢分割的效果直接影響到下一步手勢分析及最終的手勢識別。目前最常用的手勢分割法主要包括基於單目視覺的手勢分割和基於立體視覺的手勢分割。
單目視覺是利用一個圖像採集設備獲得手勢,得到手勢的平面模型 。建立手勢形狀資料庫的方法是將能夠考慮的所有手勢建立起來,利於手勢的模版匹配,但其計算量隨之增加,不利於系統的快速識別。
立體視覺是利用多個圖像採集設備得到手勢的不同圖像,轉換成立體模型 。立體匹配的方法與單目視覺中的模板匹配方法類似,也要建立大量的手勢庫; 而三維重構則需建立手勢的三維模型,計算量將增加,但分割效果較好。

手勢分析

手勢分析是完成手勢識別系統的關鍵技術之一。通過手勢分析,可獲得手勢的形狀特徵或運動軌跡。手勢的形狀和運動軌跡是動態手勢識別中的重要特徵,與手勢所表達意義有直接的關係。手勢分析的主要方法有以下幾類: 邊緣輪廓提取法、質心手指等多特徵結合法以及指關節式跟蹤法等 。
邊緣輪廓提取法是手勢分析常用的方法之一,手型因其特有的外形而與其他物體區分; 何陽青採用結合幾何矩和邊緣檢測的手勢識別算法,通過設定兩個特徵的權重來計算圖像間的距離,實現對字母手勢的識別。多特徵結合法則是根據手的物理特性分析手勢的姿勢或軌跡;Meenakshi Panwar將手勢形狀和手指指尖特徵相結合來實現手勢的識別。指關節式跟蹤法主要是構建手的二維或三維模型,再根據人手關節點的位置變化來進行跟蹤,其主要套用於動態軌跡跟蹤。

手勢識別

手勢識別是將模型參數空間裡的軌跡( 或點) 分類到該空間裡某個子集的過程,其包括靜態手勢識別和動態手勢識別,動態手勢識別最終可轉化為靜態手勢識別。從手勢識別的技術實現來看,常見手勢識別方法主要有: 模板匹配法神經網路法和隱馬爾可夫模型法。
模板匹配法是將手勢的動作看成是一個由靜態手勢圖像所組成的序列,然後將待識別的手勢模板序列與已知的手勢模板序列進行比較,從而識別出手勢。
隱馬爾可夫模型法( Hidden Markov Model,HMM) :是一種統計模型,用隱馬爾可夫建模的系統具有雙重隨機過程,其包括狀態轉移和觀察值輸出的隨機過程。其中狀態轉移的隨機過程是隱性的,其通過觀察序列的隨機過程所表現。

展望

手勢識別作為人機互動的重要組成部分,其研究發展影響著人機互動的自然性和靈活性。目前大多數研究者均將注意力集中在手勢的最終識別方面,通常會將手勢背景簡化,並在單一背景下利用所研究的算法將手勢進行分割,然後採用常用的識別方法將手勢表達的含義通過系統分析出來 但在現實套用中,手勢通常處於複雜的環境下,例如: 光線過亮或過暗有較多手勢存在手勢距採集設備距離不同等各種複雜背景因素。這些方面的難題目前尚未得到解決,且將來也難以解決 因此需要研究人員就目前所預想到的難題在特定環境下加以解決,進而通過多種方法的結合來實現適於不同複雜環境下的手勢識別,由此對手勢識別研究及未來人性化的人機互動做出貢獻。

相關詞條

熱門詞條

聯絡我們