概念
雙因素
方差分析(Double factor variance analysis) 有兩種類型:一個是無
互動作用的雙因素方差分析,它假定因素A和因素B的效應之間是相互獨立的,不存在相互關係;另一個是有互動作用的雙因素方差分析,它假定因素A和因素B的結合會產生出一種新的
效應。例如,若假定不同地區的消費者對某種品牌有與其他地區消費者不同的特殊偏愛,這就是兩個因素結合後產生的新效應,屬於有互動作用的背景;否則,就是無互動作用的背景。這裡介紹無互動作用的雙因素方差分析。
思想
雙因素方差分析的基本思想:通過分析研究中不同來源的
變異對總變異的貢獻大小,從而確定可控因素對研究結果影響力的大小。
下面用一個簡單的例子來說明雙因素方差分析的基本思想:
如某克山病區測得11例克山病患者和13名健康人的血磷值(mmol/L)如下:
問該地克山病患者與健康人的血磷值是否不同?
患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
從以上資料可以看出,24個患者與健康人的血磷值各不相同,如果用離均差平方和(SS)描述其圍繞總均數的變異情況,則總變異有以下兩個來源:
組內
變異,即由於隨機誤差的原因使得各組內部的血磷值各不相等;
組間
變異,即由於克山病的影響使得患者與健康人組的血磷值均數大小不等。
而且:SS總=SS組間+SS組內 v總=v組間+v組內,如果用均方(即自由度v去除離均差平方和的商)代替離均差平方和以消除各組
樣本數不同的影響,則方差分析就是用組內均方去除組間均方的商(即F值)與1相比較,若F值接近1,則說明各組均數間的差異沒有統計學意義,若F值遠大於1,則說明各組均數間的差異有
統計學意義。實際套用中檢驗假設成立條件下F值大於特定值的機率可通過查閱F界值表(方差分析用)獲得。
因素A位於列的位置,共有r個水平,
表示第j種水平的樣本平均數;
因素B位於行的位置,共有k個水平,
表示第I種水平的樣本平均數。
x為樣本總平均數
樣本容量為 n = r x k 。
每一個觀察值x
ij是由因素A的r個水平和因素B的k個水平所組成的總體中抽取的樣本容量為1的獨立隨機樣本。
在進行雙因素方差分析時,假定在個總體中,每一個總體都服從
常態分配,而且有相同的
方差。
套用
在實際問題的研究中,有時需要考慮兩個因素對實驗結果的影響。例如飲料銷售,除了關心飲料品牌之外,我們還想了解銷售地區是否影響銷售量,如果在不同的地區,銷售量存在顯著的差異,就需要分析原因。採用不同的銷售策略, 使該飲料品牌在市場占有率高的地區繼續深入人心,保持領先地位;在市場占有率低的地區,進一步擴大宣傳,讓更多的消費者了解、接受該產品。若 把飲料的品牌看作影響銷售量的因素A,飲料的銷售地區則是影響因素B。對因素A和因素B同時進行分析,就屬於雙因素方差分析的內容, 雙因素方差分析是對影響因素進行檢驗,究竟是一個因素在起作用,還是兩個因素都起作用,或是兩個因素的影響都不顯著。
雙因素方差分析的前提假定:採樣地
隨機性,樣本的
獨立性,分布的正態性,
殘差方差的一致性。
雙因素方差分析的方法多種多樣,比如EXCEL,matlab,spss等等;具體實現以及實現後的表達的意思還需要大家共同來完成。