簡介
主動形狀模型(ASM)最初由Cootes等人提出的,它在思想上類似於主動輪廓模型,即定義一個能量函式,通過調整模型參數使能量函式最小化。主動形狀模型是一種套用廣泛且發展成熟的人臉特徵點定位方法。人臉特徵點定位是人臉識別中的核心問題之一,它指的是在圖像或圖像序列的給定區域內搜尋部分或所有人臉特徵(如眼、鼻、嘴、耳等)的位置、關鍵點或輪廓線。在定點陣圖像中的人臉特徵點之前,人臉圖像對計算機而言只是像素值的集合;只有定位特徵點之後,計算機才能夠進一步解釋人臉圖像。實際上,人臉特徵點定位完成了從像素級別的低層語義向特徵級別的高層語義的轉化。
基本思想
主動形狀模型的基本思想是:選取一組人臉圖像的訓練樣本,用形狀向量(由所有特徵點的坐標組成)描述人臉的形狀,首先將訓練集中各樣本對齊,使樣本間形狀儘可能相似,再用
主成分分析對對齊後的形狀向量統計建模,最後在形狀向量未知的測試樣本上用局部紋理模型搜尋滿足統計描述範圍的最優形狀。使用主動形狀模型的具體步驟如下:
1. 計算目標人臉圖像的初始形狀作為當前形狀;
2. 進行下面的循環直至收斂(每一步循環對形狀的改動很微小)
對當前形狀中的每一個特徵點
對當前特徵點的鄰域內的每一個點
計算該點的局部紋理
用當前特徵點所屬的局部紋理模型計算該點局部紋理的匹配函式值
在當前特徵點鄰域的所有點中搜尋匹配函式值最小的點並把該點作為
當前特徵點
用全局統計模型修正形狀
3. 給出目標人臉圖像的形狀
結構組成
主動形狀模型可分為兩個子模型一一局部紋理模型和全局統計模型。局部紋理模型用於局部搜尋,它描述特徵點附近的紋理特徵,因此可將其作為局部搜尋的目標函式,從而局部搜尋可看成在特徵點的鄰域中尋找與該特徵點紋理特徵最相似的點;全局統計模型用於全局約束,它限定了人臉圖像中允許出現的人臉形狀。與局部紋理模型不同,它並非單個特徵點的模型,而是對所有特徵點整體建模,通過計算樣本形狀向量的統計量來約束可能出現的未知人臉形狀。局部搜尋時某些特徵點可能陷入局部極值,或者由於局部紋理模型描述不充分,導致搜尋到的特徵點偏差較大,這時,全局統計模型可以對這些點進行修正。
優缺點
ASM 的優點是能根據訓練數據對於參數的調節加以限制,從而將形狀的改變限制在一個合理的範圍內。主動形狀模型首先對一組標有特徵點圖像(稱為訓練集)的形狀和局部灰度建模,然後在搜尋過程中不斷調節形狀和姿態參數從而使形狀達到最優。
與其他統計模型結構比較,ASM模型的優勢主要體現在:
1、它是可變模型,克服了以往剛體模型的缺點,能很好的適應複雜形狀的目標定位,有良好的適應性;
2、它是參數化的模型,通過改變參數可以產生一定約束範圍內的可容許的形狀樣本,保持了形狀的特異性; 3、充分利用了物體的紋理信息建立局部紋理模型,結合全局形狀模型使得定位更加準確。
主動形狀模型也具有以下三個顯著缺點:
1、主動形狀模型的收斂速度和收斂到局部極值的可能性均依賴於初始形狀。初始形狀距離真實形狀較遠時,疊代次數會大幅增加,收斂到局部極小值的可能性也會變大;
2、主動形狀模型的1D紋理模型僅對法線方向上的像素值採樣。該法線模型可較好描述處於人臉輪廓和人臉特徵輪廓上的特徵點,但對處於人臉內部或人臉特徵內部的特徵點來說,該模型無法充分描述其局部紋理;
3、主動形狀模型的局部搜尋策略相當於在法線方向上窮舉搜尋,遍曆法線方向上的所有點並計算它們的模板匹配函式值,然後找到其中匹配值最小的點。這種搜尋策略極為簡單,沒有用到仟何最佳化搜尋策略,因此算法效率較低。
主動形狀模型與主動外觀模型的比較
主動形狀模型和主動外觀模型(Active Appearance Model, AAM)是可變形模型中實用效果顯著且經過廣泛研究的兩種方法。這兩種方法中,主動形狀模型用局部紋理模型搜尋特徵點,用全局統計模型約束特徵點集組成的形狀,二者反覆疊代最終收斂到最優形狀;主動外觀模型利用形狀和外觀之間的相關性,把二者組合成為一個向量,從而在搜尋最優外觀的同時找到最優形狀。它們前者速度較快而後者較為準確,可分別套用於實時性和精度要求較高的場合。但是,它們有一個共同的缺點:收斂性—無論速度還是精度一一均依賴於初始形狀。若初始形狀距離真實形狀較遠,則不僅疊代次數會大幅增加,而且增大了收斂到局部極小值的可能性。
改進方向與套用成果
鑒於ASM算法在特徵提取、目標定位等方面的較好性能,自提出至今一直是各相關領域的研究熱點。然後在實際定位過程中,ASM算法存在一定的局限性:比如其僅僅用到了目標物體邊界輪廓的紋理信息,定位結果易受初始狀態、圖像噪聲的影響,影響搜尋速率和定位精度的搜尋長度存在矛盾性等。許多計算機視覺領域的專家與學者對傳統ASM進行了研究與改進。
在ASM特徵擴展方面,傳統ASM算法中建立的局部紋理模型是基於特徵點的灰度
梯度信息,簡單易算,適用於簡單的圖像背景下的目標匹配。實際的圖像中往往存在光照、噪聲等諸多干擾,背景環境也更為複雜,基於簡單梯度信息的搜尋結果可能極可能出現偏差,導致最終模型無法收斂,不能有效匹配。COOteS在文獻中提出了一種改進的局部紋理模型建立方法,利用標誌點沿目標輪廓邊界法向量方向上內外兩側的灰度信息作差分運算,消除了圖像整體灰度影響,大大提高了ASM模型的匹配效果。許多學者在此基礎上對這種灰度模型又作了各種最佳化。Liu等把簡單的梯度方向一維灰度模型擴展到以特徵點為中心的多領域二維灰度模型,更充分的利用了目標豐富的紋理信息。
S.Romdhani等用核主成分分析[[42]和
支持向量機運用到人臉識別中,將模型中的非線性變化映射到高維線性空間中再進行特徵提取,從而可以描述
2D圖像中的各種
3D變化,比如深度旋轉和上下旋轉等;Jiao和Zhan充分利用小波變換的有效提取特徵和禁止無關性,基於Gabor小波和Haar小波的不同特徵對目標建立紋理模型。M.Rogers和J. Graham用一種更具魯棒性的最小二乘技術來最小化全局統計模型和未知形狀之間的差值,使得全局統計模型表示的形狀不容易被特徵點中的噪聲和野值影響。YZhou等將ASM的形狀模型映射到切空間中,用貝葉斯推斷估計形狀參數,使得
貝葉斯切形狀模型能更好的與圖像序列中的目標輪廓匹配。H.Chen等運用人臉草圖的生成方法,檢測眼睛和嘴唇的輪廓,在眼角和嘴角附近的高曲率特徵點上採用二維紋理模型替換,獲得了較好的匹配效果。
在ASM模型的基礎上,Cootes等人為提高定位效果,進一步提出了主動表觀模型C Active Appearance Models(AAM)。主動表觀模型是對ASM算法在紋理模型上的擴充,把目標的局部紋理模型擴充為全局紋理模型,融合統計形狀和紋理建立為表觀模型用於目標定位。在搜尋過程中,假設兩種線性映射:從表觀變化到紋理變化,再從紋理變化到位置變化。依據他們相互映射關係來調整模型參數,獲得與目標相匹配的形狀模型和紋理模型。計算當前得到的形狀模型紋理和目標圖像紋理之間的差值,當兩者之差達到最小時,認為合成圖像與待檢測圖像最為接近,停止搜尋生成最優匹配結果。主動表觀模型不僅可以提取目標物體的形狀特徵,還可以表達目標物體的紋理特徵,是特徵提取和目標識別研究領域又一里程碑式算法。但是,主動表觀模型的運用也有較大局限性。該算法假設形狀和外觀與差分圖像成線性關係,在此基礎上更新模型參數。而事實上由於光照變化、環境噪聲等干擾,線性關係並不成立,因此參數的更新也不準確。另外,由於加入了目標圖像的整體紋理信息,主動表觀模型比主動形狀模型的計算數據量明顯增加,運行較慢,達不到快位定位的效果。
在提高ASM搜尋速率方面,Cootes等提出了多解析度搜尋策略來改進傳統ASM算法,通過由粗到精的策略既可以提高擬合的精度,又能提高搜尋的速度,即使初始模型離目標位置較遠,利用多解析度搜尋策略也能實現較為快速的定位。在此基礎上,Davatzikos等採用了
小波變換的方法來實現多尺度多解析度ASMo Yan等提出了一種改進的TC-ASM算法,利用全局紋理信息限制形狀的變化,使得對目標性狀的定位更為精確,收斂速率更為快速。Rogers等用改進的
最小二乘法對全局統計模型和目標形狀模型計算最小差值,使得全局統計模型表示的目標形狀更具有魯棒性,同時被成功運用於醫學圖像處理。GHamarneh等充分借鑑Snake模型能生成光滑連續的邊界曲線的優點,結合ASM模型能保持目標特異性的優點,將改進的方法進行醫學圖像分割。Yuan等用支持向量機(Support Vector Machine SVM)作為
分類器,避免了搜尋過程中相鄰特徵點之間的關係發生改變。Gross等提出針對訓練集個體進行建模,同時研究了物體發生被遮擋情況時的建模問題和搜尋策略,提高了定位的準確性。