專利背景
隨著汽車保有量的迅速增加,人們對汽車安全的重視程度越來越高。車輛在行駛過程中,車主操作車載GPS、DVD等娛樂系統時,必須抽出手來去按鍵或者觸摸HMI界麵點擊圖示,同時還要低頭查看操作界面,然後再選擇所需求的功能,這樣在駕駛過程中會不可避免的會出現安全隱患,嚴重者甚至會造成不可挽回的人身財產損失。
而針對技術本身而言,截至2014年6月的手勢識別都是採用空間算法計算手勢的空間運動軌跡,算法複雜,模組較多,成本較高;同時對於車載影音娛樂系統而言,功能過於繁雜,成本較高,顯得華而不實。
因此,在保證車主安全駕駛的同時,又方便其對娛樂影音系統的操作,《一種基於坐標變換的手勢識別方法》提出了一種基於坐標變換的手勢識別算法。該算法主要用於車載娛樂影音系統的手勢識別模組,其特點是可迅速準確地識別車主的手勢如接近、離開、左滑、右滑等狀態,使得車主在不影響駕駛的情況下,更加方便地進行娛樂影音系統的各種操作。
當前針對車載影音娛樂系統的手勢識別算法專利較少,與傳統行業相關技術相比,以專利公開(公告)號102880287A為例,有計算模組和加速度判斷模組等,模組較多,裝置採用攝像頭等採集手勢運動軌跡,成本較高。與之相比,《一種基於坐標變換的手勢識別方法》模組更少,成本更低,算法更簡潔,功能對產品的針對性更強。
發明內容
專利目的
《一種基於坐標變換的手勢識別方法》的主要目的是提供一種基於坐標變換的手勢識別方法,解決傳統手勢識別算法中模組較多、裝置複雜以及成本較高等問題。
技術方案
一種基於坐標變換的手勢識別方法,該方法按照以下步驟進行:
步驟一、建立一個二維度坐標系,X軸代表水平方向,Z軸代表垂直方向,將手勢的動作擬化到坐標繫上,X軸擬化為手勢相對於操作體的左滑或右滑,Z軸擬化為手勢相對於操作體的接近或離開,且X軸和Z軸有效區段的坐標值均為0~H,H為根據實際需要設定的正整數,有效區段是指能夠觸發中斷的手勢所在的有效區域分別映射至X軸和Z軸的部分,操作體指手勢的作用對象;
步驟二、在X軸方向上有效區域內等間距地設定K個紅外線感測器Gn(n=1,……i,j……K;i,j≤K),用於採集人體的紅外數據,其中K≥2;
步驟三、當手勢在有效區域,則觸發中斷,系統開始對各感測器採集的紅外數據進行定時採樣得到的與Gn對應的數據值Dn(n=1,……i,j……K;i,j≤K);
步驟四、根據採樣得到的數據值Dn將當前手勢運動點B映射為二維坐標系值,映射方法為:
X軸的映射:觀測採樣得到的數據值,將映射點初步定位在數據值較大的兩個感測器Gj、Gi所界定的坐標段內,將該坐標段等分成Di+Dj等份;每份的值為1/(Di+Dj),根據感測器數值與感應距離成反比的關係,映射點到Gi的單位值為Dj/(Di+Dj),根據坐標軸的實際標值可計算得出當前手勢運動點B映射至X軸的坐標值為(H/K-1)*Dj/(Di+Dj)+(H/K-1)*(i-1);
Z軸的映射:將Z軸的有效區域進行255等份,每等份為1/255,取最大紅外感測器的值Dj,則Z軸原點至映射點的單位值為1-Dj/255,根據坐標軸的實際標值可計算得出當前手勢運動點B映射至Z軸的坐標值為H*(1-Dj/255);
步驟五、通過最小二乘法,將多個手勢運動點映射至二維坐標繫上的多組坐標值分別歸化為X軸上的坐標值與採樣次數之間的關係所形成的最接近的一條直線,以及Z軸上的坐標值與採樣次數之間的關係所形成的最接近的一條直線;
步驟六、通過上述歸化所得直線的斜率來判斷手勢運動狀態。
優選地,所述步驟六中,判斷手勢運動狀態的方法具體為:當X軸數值與採樣次數的關係所歸化的函式斜率大於零時,則判斷手勢為自左向右滑動;反之當斜率小於零時,則判斷手勢自右向左滑動;當Z軸數值與採樣次數的關係所歸化的函式斜率大於零時,則判斷手勢為遠離;反之當斜率小於零時,則判斷手勢為靠近。
優選地,所述步驟三中,預設一個紅外數據閾值,當紅外線感測器採集的紅外數據大於預設閾值時,則表示手勢處在有效區域內,中斷即被觸發,系統開始定時採樣。
優選地,系統定時採樣獲得採樣數據後,將採樣數據值低於預設閾值的無效數據濾除。
優選地,當手勢完成離開中斷區域,系統檢測到感應的數據全部為無效數據,關閉定時器,等待下一次中斷。
優選地,根據手勢運動速度確定採樣定時器的計量單位。
改善效果
《一種基於坐標變換的手勢識別方法》具有如下的優點和有益效果:
1、《一種基於坐標變換的手勢識別方法》主要針對車載影音娛樂系統,極大的提升了該系統的可操作性,能有效的解決由於繁瑣的操作而出現的汽車駕駛安全隱患;
2、《一種基於坐標變換的手勢識別方法》算法更簡單可行,模組更少,算法和功能對產品的針對性更強;
3、《一種基於坐標變換的手勢識別方法》已實施到車載GPS導航產品,並實驗測試,結果證明算法安全可靠,實用性高。
附圖說明
圖1是《一種基於坐標變換的手勢識別方法》手勢運動原理示意圖;
圖2是《一種基於坐標變換的手勢識別方法》手勢運動二維坐標變換原理圖;
圖3為最小二乘法直線擬化原理圖;
圖4是《一種基於坐標變換的手勢識別方法》軟體算法原理圖。
技術領域
《一種基於坐標變換的手勢識別方法》涉及手勢識別技術領域,特別涉及一種基於坐標變換的手勢識別方法。
權利要求
1.一種基於坐標變換的手勢識別方法,其特徵在於:包括以下步驟:
步驟一、建立一個二維度坐標系,X軸代表水平方向,Z軸代表垂直方向,將手勢的動作擬化到坐標繫上,X軸擬化為手勢相對於操作體的左滑或右滑,Z軸擬化為手勢相對於操作體的靠近或離開,且X軸和Z軸有效區段的坐標值範圍均為0~H,H為根據實際需要設定的正整數,所述操作體指手勢的作用對象,所述有效區段是有效區域分別映射至X軸和Z軸的部分,其中,所述有效區域是指能夠觸發中斷的手勢所在坐標系內的區域;
步驟二、在X軸方向上有效區段內等間距地設定K個紅外線感測器Gn(n=1,……i,j……K;i,j≤K),用於採集人體手部的紅外數據,其中K≥2;
步驟三、當手勢處於有效區域,則觸發中斷,系統開始對各感測器採集的人體手部紅外數據進行定時採樣得到的與Gn對應的數據值Dn(n=1,……i,j……K;i,j≤K);
步驟四、根據採樣得到的數據值Dn將當前手勢運動點B映射為二維坐標系值,映射方法為:X軸的映射:觀測採樣得到的數據值,將映射點初步定位在數據值較大的兩個感測器Gj、Gi所界定的坐標段內,將該坐標段等分成Di+Dj等份;每份的值為1/(Di+Dj),根據感測器數值與感應距離成反比的關係,映射點到Gi的單位值為Dj/(Di+Dj),根據坐標軸的實際標值可計算得出當前手勢運動點B映射至X軸的坐標值為(H/K-1)*Dj/(Di+Dj)+(H/K-1)*(i-1);Z軸的映射:將Z軸的有效區域進行255等份,每等份為1/255,取最大紅外感測器的值Dj,則Z軸原點至映射點的單位值為1-Dj/255,根據坐標軸的實際標值可計算得出當前手勢運動點B映射至Z軸的坐標值為H*(1-Dj/255);
步驟五、通過最小二乘法,將多個手勢運動點映射至二維坐標繫上的多組坐標值分別歸化為X軸上的坐標值與採樣次數之間的關係所形成的最接近的一條直線,以及Z軸上的坐標值與採樣次數之間的關係所形成的最接近的一條直線;
步驟六、通過上述歸化所得直線的斜率來判斷手勢運動狀態。
2.如權利要求1所述的基於坐標變換的手勢識別方法,其特徵在於:所述步驟六中,判斷手勢運動狀態的方法具體為:當X軸數值與採樣次數的關係所歸化的函式斜率大於零時,則判斷手勢為自左向右滑動;反之當斜率小於零時,則判斷手勢自右向左滑動;當Z軸數值與採樣次數的關係所歸化的函式斜率大於零時,則判斷手勢為遠離;反之當斜率小於零時,則判斷手勢為靠近。
3.如權利要求1或2所述的基於坐標變換的手勢識別方法,其特徵在於:所述步驟三中,預設一個紅外數據閾值,當紅外線感測器採集的紅外數據大於預設閾值時,則表示手勢處在有效區域內,中斷即被觸發,系統開始定時採樣。
4.如權利要求1或2所述的基於坐標變換的手勢識別方法,其特徵在於:當手勢完成離開中斷區域,系統檢測到感應的數據全部為無效數據,關閉定時器,等待下一次中斷。
5.如權利要求1或2所述的基於坐標變換的手勢識別方法,其特徵在於:根據手勢運動速度確定採樣定時器的計量單位。
6.如權利要求3所述的基於坐標變換的手勢識別方法,其特徵在於:系統定時採樣獲得採樣數據後,將採樣數據值低於預設閾值的無效數據濾除。
實施方式
《一種基於坐標變換的手勢識別方法》提供一種基於坐標變換的手勢識別方法,該方法主要按以下方面進行:
1、二維坐標系的建立
建立二維坐標系如圖1所示,其中,X軸代表水平方向,擬化為手勢的左滑右滑,Z軸代表垂直方向,擬化為手勢的接近離開,G1、G2、G3分別代表紅外感測器的位置,0、1、2相連所繪製的曲線為Z軸方向上有效區域的邊界線,曲線以內為有效區,曲線以外為無效區,A、B、C為模擬的手勢移動曲線,為方便計算,選用3個紅外線感測器。
為提高手勢判斷精確性,需儘可能多的數據來進行分析,因此採用定時器來設定採樣頻率,一旦觸發中斷,系統定時採樣,然後根據算法計算,判斷手勢動作。
2、一維數據映射為二維坐標系(x,z)值方法
如圖2所示,手勢觸發紅外中斷,系統定時採集數據,以當前手勢在B點為例,採樣點數據有三個,即感測器1值為m、感測器2值為n,感測器3值為p。設計算法如下:
①為方便等分換算,將x軸13段、z軸14段均轉換為數值範圍為0~100的二維坐標系。
②針對x軸的映射關係:
步驟一;觀測紅外值,有n>m>p。
步驟二:由於感測器3感應值p較感測器1感應值m小,故將手勢B點定位在12段範圍。
步驟三:將手勢B點映射到x軸靠近2,也即H點處。
步驟四:手勢B點映射到x軸的值為50*n/(m+n)。
坐標變換算法:n是感測器2的感應數值,s為選用感測器個數3,將x軸三個感測器的距離100等份,則線段12與23均為50,由於感測器數值與感應距離成反比,將12線段等分成m+n等份,B點映射到x軸上的點為H,每份的值為1/(m+n),1H段映射單位值為n/(m+n),H2段映射單位值為m/(m+n),則B點映射到x軸的值為50*n/(m+n)。
③針對z軸的映射關係:
步驟一:取最大紅外感測器的值n。
步驟二:手勢B點映射到z軸的值為100*(1-n/255)。
坐標變換算法:由於感測器感應值與z軸感應距離成反比,先將z軸的有效區域14段255等份,B點映射到z軸上的點為S,每份的值為1/255,映射1S段的單位值為(1-n/255),再將z軸的有效觸發距離14段轉化為與x軸一致的0~100的二維坐標系,則B點映射到z軸的值為:(1-n/255)*100。
3、手勢識別判斷算法
考慮到紅外感測器值浮動偏差,單純比較相鄰兩組數據的x軸、z軸的值很可能出現誤報,因此擬採用多組數據分析,然後通過最小二乘法,將多組數據歸化為最接近的一條直線,通過該直線的斜率來判斷手勢狀態。
最小二乘法擬化直線原理:
設x和y之間的函式關係為:y=bx+a。
式中有兩個待定參數,b代表斜率,a代表截距。對於等精度測量所得到的N組數據(xi,yi),i=1,2……,N,xi(count採樣數據個數)值被認為是準確的,所有的誤差只聯繫著yi(x,z軸的值)。利用最小二乘法把觀測數據擬合為直線。
用最小二乘法估計參數時,要求觀測值yi的偏差的加權平方和為最小。對於等精度觀測值的直線擬合來說,可使下式的值最小:
上式分別對a、b求偏導
整理後得到方程組
便可求得直線參數a和b的最佳估計值。
然後根據斜率b的大小來判斷x軸、z軸的滑動趨勢。
中斷觸發,系統定時TIM採集一次紅外數據,採樣80次為一組數據,過濾後有效數據為16組,以x軸為例,建立與次數相關的二維坐標系如圖3所示,映射到x軸的值隨著採樣次數count的增大而變化。採用最小二乘法將採集到的16組有效數據歸化為最接近的一條直線y=bx+a,通過斜率b來判斷手勢狀態。當b>0時,自左向右滑動;當b<0時,自右向左滑動。
同理,z軸的值也隨著採樣次數count的增大而變化。若歸化為直線y1=bx1+a,則當b>0時,遠離;當b<0時,靠近。
當手勢完成離開中斷區域,系統檢測到感應的數據全部為無效數據後,關閉
定時器,等待下一次中斷。
優選地,在該算法中可預先設定紅外數據閾值,當感測器採集的數據值大於閾值時,則表示手勢處在有效區域內,中斷即被觸發,系統開始定時採樣。
優選地,在該算法對採樣數據進行二維變換前,可先將採樣數據進行過濾以濾除無效數據,從而減小噪聲影響。
圖4示出了《一種基於坐標變換的手勢識別方法》基於坐標變換的手勢識別算法的軟體原理框圖,在駕駛汽車時,駕駛員一個揮手手勢約300毫秒,針對手勢滑動速度,《一種基於坐標變換的手勢識別方法》採用毫秒級定時器來設定採樣頻率。一旦手勢觸發中斷,系統定時採樣,然後設定濾波閾值過濾掉噪聲干擾數據,再根據以上坐標變換和最小二乘濾波算法計算,判斷手勢動作,當手勢完成離開中斷區域,系統檢測到感應的數據全部為無效數據後,關閉定時器,等待下一次中斷。
榮譽表彰
2018年12月20日,《一種基於坐標變換的手勢識別方法》獲得第二十屆中國專利優秀獎。