基本介紹
由於曲線回歸中計算相關指數需先確定回歸方程才能計算,而回歸方程的形式往往不易確定。K·皮爾生提出用相關比以代替相關指數,這樣可以不確定回歸方程而直接計算二個變數的相關程度,其方法是取對應於自變數某值的因變數均值來代替估計值。設有X,Y兩變數的n對數據整理成相關表如下:
| x1 | … | xi | … | xk | 合計 |
y1 | f11 | … | fil | … | fkl | f·1 |
… | … | | … | | … | |
yj | f1j | … | fij | … | fkj | f·j |
… | … | | … | | … | |
yl | f1l | … | fil | … | fkl | f·l |
合計 | f1· | | fi· | | fk· | n |
用ηy·x表示y對x的相關比, 其計算公式為
其中
,需要指出y對x的回歸與x對y的回歸不同,因此其相關比也不同。
相關比的性質
相關比有下列性質:
1. 0≤ηy·x≤1;
2. 相關比的數值愈大,表示兩變數間的非直線相關愈密切;
3. 相關比必大於或至少等於由同一資料所計算的
相關係數的絕對值, 即η
y·x≥|r|。
相關比
相關比是曲線相關的指標。從變數觀測值的分布情況或散點圖上看,兩變數沒有直線關係而呈現曲線趨勢時,不能計算
積矩相關係數,應當計算兩變數的相關比作為曲線相關程度的指標。例如,有機體的喚醒水平與幼兒的學習能力之間存在某種關係,即學習能力隨喚醒水平增長而逐漸提高,但當喚醒水平達到某一高度時,情況則開始發生變化,學習能力隨喚醒水平增長而逐漸下降,欲考察這兩種變數間的相關情況,就必須採用相關比。相關比的計算公式為:
式中
為各列y變數與該列實際平均數之差的方差,
為全部y變數的方差。具體的計算方法是:將其中一個變數當作分類變數,另一變數的觀測值被分到不同的組(類)內,列成雙向次數分布表。然後像進行方差分析一樣,算出
組間平方和與
總平方和,兩者之比的平方根即為兩變數的相關比。相關比的取值範圍為0~1。數值越大,相關程度越高。但是,要解釋相關比的實際含義,就需要結合圖形說明,用圖形說明關係的形式,用係數說明關係的程度,因為同一相關比值可表現為不同方向的圖形。