逐步判別法是利用一些檢驗規則,對變數進行逐步篩選,同時進行判別的一種方法。
基本介紹
- 中文名:逐步判別法
- 外文名:Stepwise discriminant
- 理論基礎:附加信息檢驗
- 基本思想:逐步引入變數
- 定義:方法
逐步判別法的理論基礎,逐步判別法的基本思想,逐步判別的原則,逐步判別法在綠茶板栗香化學識別上的套用,分析方法,判別變數的篩選,研究結論,
逐步判別法的理論基礎
逐步判別法的理論基礎是附加信息檢驗。
設有 K 個母體G1 ,…,GK ,它們的分布是 N ,今從這K個母體分別抽了n1 ,…nk 個樣品,為了對這K個母體建立判別函式,需要檢驗。
H0 :μ1 =…= μK
當H0 被接受時,說明區分這 K 個總體是無意義的,當假定被否定時,說明這K個母體可以區分,建立判別函式是有意義的。考慮為了區分這K個母體,原來選擇的這 M 個指標是否可以減少而達到同樣的判別效果,也就是說要去掉一些區分 K 個母體不帶附加信息的變數。
逐步判別法的基本思想
逐步判別法的基本思想是:逐步引入變數,每次引入一個"最重要"的變數,同時也檢驗先前引入的變數,如果先前引入的變數其判別能力隨新引入變數而變不顯著,則及時將其從判別式中剔除,直到判別式中的變數都很顯著,且剩下來的變數也沒有重要的變數可引入判別式時,逐步篩選結束。其實逐步判別和逐步回歸的思想差不多,就是不斷的對篩選的變數作檢驗,找出顯著性變數,剔除不顯著變數。
逐步判別的原則
在y1 ,y2 ,…ym 中先選出一個變數,它使維爾克斯統計量達到最小。不失一般性,假設挑選的變數次序是按自然的次序,即第 r 步正好選中yr ,第一步選中y1 ,則
Λ1 =min{Λi }
並考察Λ1 是否落入接受域,如不顯著,則表明一個變數也選不中,不能用判別分析;如顯著,則進入下一步。
在未選中的變數中,計算它們與已選中的變數y1 配合的Λ 值,選擇使Λ1i 達到極小的作為第二個變數。
仿此,如已選入了 r 個變數,不防設y1 ,…yr ,則在為選中的變數中逐次選一個與它們配合,計算Λ {1,2,…,r,l} ,選擇使上式達到極小的變數作為第 r+1 個變數,並檢驗新選的第 r+1 個變數能否提供附加信息,如不能則轉入5,否則轉入4
在已選入的 r 個變數中,要考慮較早選中的變數中其重要性有沒有較大的變化,應及時把不能提供附加信息的變數剔除出去。剔除的原則同於引進的原則。例如在已進入的r個變數中要考察yl 是否需要剔除,就是計算Λ {l.1,…,l-1,,l+1,…}, r 選擇達到極小的l,看是否顯著,如不顯著將該變數剔除,仍回到4,,繼續考察餘下的變數是否需要剔除,如顯著則回到3。
這時既不能選進新變數,又不能剔除已選進的變數,將已選中的變數建立判別函式。
逐步判別法在綠茶板栗香化學識別上的套用
綠茶香氣是決定綠茶品質和風味的重要因子之一,歷來受到研究者的重視。迄今為止,已分離鑑定的綠茶香氣組分有300餘種,並且隨著樣品前處理技術、定性和定量分析技術的迅猛發展,不斷有新的綠茶香氣成分被發現和鑑定,一方面,對綠茶香型的研究起到了極大的促進作用,另一方面,綠茶香氣成分的眾多,各芳香成分之間絕對含量、比例、閥值等因素的差異,構成了綠茶香型成因的多維性,也給綠茶香型的分析帶來了一定的困難,特別是茶樣香氣信息遠遠超過了人的主觀分析能力時。
對茶葉香型的識別主要採用感官審評的方法。但是,人的感官審評帶有較大的主觀因素,其審評結果存在相當大的個體差異,即使是同一個人,其嗅覺靈敏度也易受環境、工作程式、情緒、工作量等諸多因素的影響。為了使茶葉的感官審評更客觀,使分析結果更可靠,有必要尋找一些方法將現代儀器分析技術、綠茶中芳香物質的信息、茶葉香型聯繫起來,為茶葉香型的判斷提供一種更為全面、客觀、可靠的方法,同時也為茶葉香型的計算機線上識別等其它香氣分析技術在茶葉中的套用提供理論基礎或參考。
研究擬用Bayes逐步判別法從香氣成分、含量等信息上對綠茶的板栗香進行識別,並結合主成分分析對判別效果進行考察,為綠茶香型的理論研究和套用開發提供一定基礎。
分析方法
用SAS9.0中stepdisc過程進行變數篩選,discrim過程對樣品判別、驗證,analysis模組進行主成分和多重比較分析。
判別變數的篩選
根據各茶樣感官審評的結果,將茶樣分為兩大類:板栗香(1,2,12,13,24,25#茶樣)和非板栗香(3~11,14~23,26#茶樣)。以1~18#茶樣為訓練樣本,套用SAS軟體Stepdisc過程從具板栗香茶樣的26種共有香氣成分中篩選出對區分板栗香與非板栗香有顯著性影響的香氣成分。模型引入和剔除變數的水平:0.15。從表2篩選結果,可知,依次有β-紫羅蘭酮、順-茉莉酮和香葉基丙酮被引入,但香葉基丙酮被引入後,β-紫羅蘭酮因其P值變為0.2604<0.15而被剔除。
研究結論
判別分析已廣泛套用於變數的篩選、產品的分類分析、醫學症狀的診斷與分析等,在酒類、茶葉等食品的香氣與香型上也有所涉及,但在茶葉各香型的比較研究中未見報導。
茶葉香型的呈現是由茶葉中各種芳香成分綜合作用的結果,各香型茶樣香氣成分繁多,成分含量、比例等信息千差萬別,形成了茶葉香型研究的複雜性。但並不是每個香氣成分對香型的表現都有重要貢獻,研究套用Bayes逐步判別法從龐雜的香氣信息中篩選出板栗香與非板栗香的顯著性差異成分——順-茉莉酮和香葉基丙酮,判別分析、交叉驗證和樣本驗證結果表明,Bayes逐步判別分析適用於綠茶香型的識別,並且識別效果理想。因此,通過Bayes逐步判別分析可以將茶葉的香型特徵與其客觀香氣成分信息有機地聯繫起來,有利於從香氣成分及其量上的差異揭示各種香型呈現的化學基礎,並可將香型描述加以量化、識別。此外,通過本研究,可為香型的線上識別、香型特徵性成分的尋找、香型的呈現、調配等技術提供有力的基礎。