簡單相關係數

簡單相關係數

簡單相關係數又稱皮爾遜相關係數或“皮爾遜積矩相關係數”或叫線性相關係數,是指兩個定距變數間聯繫的緊密程度。相關係數可以看作是兩個隨機變數中得到的樣本集向量之間夾角的tan函式。

基本介紹

  • 中文名:簡單相關係數
  • 又名:皮爾遜相關係數
  • 又稱:皮爾遜積矩相關係數
  • 描述:兩個定距變數間聯繫的緊密程度
  • 套用領域數學
  • 所屬科目:數學
簡介,幾何特徵,

簡介

樣本的簡單相關係數一般用r表示,計算公式為:
簡單相關係數
其中n 為樣本量,
分別為兩個變數的觀測值均值。r描述的是兩個變數間線性相關強弱的程度。r的取值在-1與+1之間,若r>0,表明兩個變數是正相關,即一個變數的值越大,另一個變數的值也會越大;若r<0,表明兩個變數是負相關,即一個變數的值越大另一個變數的值反而會越小。r 的絕對值越大表明相關性越強,要注意的是這裡並不存在因果關係。若r=0,表明兩個變數間不是線性相關,但有可能是其他方式的相關(比如曲線方式)。
利用樣本相關係數推斷總體中兩個變數是否相關,可以用t 統計量對總體相關係數為0的原假設進行檢驗。若t 檢驗顯著,則拒絕原假設,即兩個變數是線性相關的;若t 檢驗不顯著,則不能拒絕原假設,即兩個變數不是線性相關的。

幾何特徵

對於居中的數據來說(何謂居中?也就是每個數據減去樣本均值,居中後它們的平均值就為0), 一些實際工作者更喜歡用非居中的相關係數(與Pearson係數不相兼容)。看下面的例子中有一個比較。 例如,假設五個國家的國民生產總值分別是1、2、3、5、8(單位10億美元),又假設這五個國家的貧困比例分別是11%、12%、13%、15%、18%。則我們有兩個有序的包含5個元素的向量x、y:x = (1, 2, 3, 5, 8) 、 y = (0.11, 0.12, 0.13, 0.15, 0.18) 使用一般的方法來計算向量間夾角(參考數量積),未居中的相關性係數如下:
上面的數據實際上是故意選擇了一個完美的線性關係:y = 0.10 + 0.01 x。因此皮爾遜相關係數應該就是1。把數據居中(x中數據減去 E(x) = 3.8 ,y中數據減去E(y) = 0.138)後得到:x = (−2.8, −1.8, −0.8, 1.2, 4.2)、 y = (−0.028, −0.018, −0.008, 0.012, 0.042),由此得到了預期結果:

相關詞條

熱門詞條

聯絡我們