基本介紹
- 中文名:淨分析物預處理法
- 外文名:Net analyte pretreatment
- 提出:Goico-echea等人
- 出現:2001年
- 基礎:Lorber的淨分析物信號理論
- 目的:濾除無用信息
- 縮略詞:NAP
淨分析物預處理法,簡化蘋果糖度預測模型,綠茶中兒茶素的近紅外光譜定量分析,
淨分析物預處理法
淨分析物預處理法(Net Analyte Preprocessing,NAP)是一種較新的光譜預處理方法,該法由Goico-echea等人(2001年)首先提出,它基於Lorber的淨分析物信號(Net Analyte Signal,NAS)理論,主要用於剔除光譜中與待測品質無關的信息。
淨分析物預處理基本原理
淨分析物預處理法的基本思想是:利用數學空間正交的方法,將原始光譜矩陣中待測組分的淨分析物信號提取出來,從而達到濾除無用信息的目的。
在農產品品質的近紅外光譜無損檢測中,偏最小二乘法(partial least square,PLS)常被用於建立預測模型。但是由於農產品是非常複雜的生物體,加上近紅外區的譜帶複雜、重疊多,因此農產品光譜中與待測品質不相關的信息必定會對待測品質的近紅外預測產生影響,特別是會造成偏最小二乘預測模型的主因子數增多,使模型變得過於複雜。為了解決這一問題,常採用二階導數光譜、小波閾值法等對近紅外光譜進行預處理。
簡化蘋果糖度預測模型
蘋果光譜的淨分析物預處理原理如下:設蘋果校正集的近紅外原始光譜矩陣為X(I×J,I為測試集樣本數,J為波長數),該矩陣中的某一元素xij(i=1,2,…,I;j=1,2,…,J)的含義是第i個樣本在第j個波長處的反射率,蘋果糖度實測值向量為y(I×1)。X可以表示為兩個部分的和,其中一部分是與糖度相關的信息,另一部分是與糖度不相關的所有干擾信息(包括來自蘋果內部的以及來自環境的干擾信息)的綜合,即X=XSC+X-SC(1)
式中,XSC表示蘋果光譜中與糖度相關的信息,X-SC則表示光譜中糖度之外的所有其他干擾信息的綜合。
尋求一個與X-SC正交的J×J階矩陣FNAP(即X-SCFNAP=0),使式(1)兩邊同乘以FNAP後有XFNAP=XSCFNAP成立,這一步為NAP算法的關鍵步驟。矩陣FNAP的求解過程為:
(1)原始光譜矩陣X向糖度實測值向量y作正交投影得到X-SC=[I-y(yTy)-1yT]X,式中I為I×I階單位矩陣;
(2)求平方矩陣[(X-SC)TX-SC]的特徵向量矩陣U(為J×A階矩陣,U中的每一列為一個NAP因子);
(3)構造矩陣FNAP=I-UUT(式中I為J×J階單位矩陣)。然後即可求出經A個NAP因子處理後的光譜X*SC=XFNAP=X(I-UUT),
式中X*SC為經淨分析物預處理法處理後得到的光譜矩陣,即糖度的淨分析物信號矩陣。預測集蘋果光譜XUN的淨分析物預處理按式X*UN,SC=XUN[I-UUT]進行,X*UN,SC為預測集蘋果光譜中糖度的淨分析物信號矩陣。
綠茶中兒茶素的近紅外光譜定量分析
綠茶中含有大量的兒茶素,具有抗癌防癌和抗氧化等功效,正受到越來越多的關注。綠茶中兒茶素類物質成分複雜,數量與種類繁多,其中最主要的三類兒茶素分別是表沒食子兒茶素沒食子酸酯(epigallocatechin gallate,EGCG)、表兒茶素沒食子酸酯(epicatechin gallate,ECG)和表沒食子兒茶素(epigallocatechin,EGC)。它們也是形成茶湯苦澀、收斂和鮮爽等滋味的重要因子。隨著綠茶消費量的增加,綠茶的品質質量的控制得到了更多的關注,其中,EGCG、ECG和EGC含量通常是衡量綠茶品質的重要參數。
綠茶中兒茶素含量的測定通常情況下採用高效液相色譜和毛細血管電泳等理化檢測方法,這些方法費時費力,而且屬於破壞性檢測,不適合綠茶流通過程中的快速檢測。近紅外光譜檢測技術由於具有快速、無損以及可以同時檢測多種品質的優點,近年來越來越廣泛地被套用到茶葉及其它農產品品質的檢測中。但採集得到的原始光譜數據常含有因外界環境不穩定造成的噪音信息以及與待測品質不相關的冗餘信息等,在模型的校正過程中,這些信息的介入勢必會增加模型的複雜程度,影響模型的精度和穩定性。常規的光譜數據預處理方法有標準正態變數(SNV)、多元散射校正(MSC)、一階導數(FOD)和二階導數(SOD)等,它們可以濾除因儀器或外界環境不穩定造成的噪音信號或基線漂移,但是這些方法不能消除光譜信號中與待測成分不相關的冗餘信息。前期研究工作發現,在利用近紅外光譜技術檢測綠茶中兒茶素含量時,進行常規預處理後,建立的PLS模型往往過於複雜(模型的主成分因子數過高),影響了模型的穩定性。鑒於此,本研究嘗試採用一種新的光譜數據預處理方法——淨分析物預處理法(net analyte preprocessing,NAP)對綠茶的近紅外原始光譜進行預處理。NAP通過空間正交的途徑最大程度地剔除了原始光譜中與兒茶素含量不相關的信息,並結合PLS方法建立EGCG、ECG和EGC含量的預測模型,以期獲得較為理想的簡化模型。