標準回歸係數

標準回歸係數

標準回歸係數,是指消除了因變數自變數所取單位的影響之後的回歸係數,其絕對值的大小直接反映了自變數對因變數的影響程度。標準化回歸係數的比較結果只是適用於某一特定環境的,而不是絕對正確的,它可能因時因地而變化。

基本介紹

  • 中文名:標準回歸係數
  • 外文名:Standard regression coefficient
  • 學科:數學、統計學
  • 特點:可能因時因地而變化
前提,定義,公式,實際意義,注意,

前提

標準化回歸係數(Beta值)在多元回歸中被用來比較變數間的重要性,但是由於重要性這一詞意義的含糊性,這一統計常被誤用。
有時人們說重要性,是指同樣的條件下,哪一個東西更有效。在提高教學質量上,是硬體條件更重要還是師資更重要?如果是師資更重要,那么同樣的物力投在師資上就可以更快地提高教學質量。但是這裡要比較的兩者必須有同樣的測量單位,如成本(元)。如果變數的單位不同,我們不能絕對地說哪個變數更重要。不同單位的兩個東西是不能絕對地比出高低輕重來。要想進行絕對地比較,就需要兩個東西有著共同的測度單位,否則無法比較。

定義

數據標準化,即將原始數據減去相應變數均數後再除以該變數的標準差,計算得到的回歸方程稱為標準化回歸方程,相應得回歸係數為標準化回歸係數。

公式

若假定回歸方程的形式如下:
其中,Y是估計值,參數
通過最小二乘法求得。
則標準化回歸係數等於
(
的標準差
的標準差)。

實際意義

標準化回歸係數說的重要性則與上面前提中所說的意義不同,這是一種相對的重要性,與某種情況下,自變數間的離散程度有關。
比如說,雖然我們不能絕對地說出教育和年資在決定收入上那一個一定是重要的,但如果現在大家的教育程度比較相似,那么在收入的決定上,工作年數就是決定因素;反之,如果工作年數沒有太大區別,那么教育就成為了重要原因。這裡的重要性是相對的,是根據不同情況而改變的。
再舉一個通俗的例子,研究者研究的是遺傳因素和後天因素對於人成長的影響。那么在一個社會境遇懸殊巨大的環境中,有人在貧民窟成長,有人在貴族學校上學,那么我們會發現人格的大部分差異會從後天環境因素得到解釋,而遺傳的作用就相對較小;相反,如果兒童都是在一個相差不大的環境中長大的,你會發現,遺傳會解釋大部分的人格差異。
這種意義上的重要性,不僅與這一自變數的回歸係數有關係,而且還與這個自變數的波動程度有關係:如果其波動程度較大,那么就會顯得較為重要。標準化回歸係數正是測量這種重要性的。從標準化回歸係數的公式 中也可看出,Beta值是與自變數的標準差成正比的,自變數波動程度的增加,會使它在這一具體情況下的重要性增加。
但是如果將兩種重要性混同,就會得到誤導性結論。如環境因素的Beta值比遺傳因素的Beta值大,就認為在個體的人格發展上應更注意環境因素,而輕視遺傳因素,在目前對於Beta值的錯誤觀念非常流行,甚至是一些高手中。

注意

標準化回歸係數的比較結果只是適用於某一特定環境的,而不是絕對正確的,它可能因時因地而變化。舉例來說,從某一次數據中得出,在影響人格形成的因素中,環境因素的Beta值比遺傳因素的Beta值大,這只能說明數據採集當時當地的情況,而不能加以任何不恰當的推論,不能絕對地不加任何限定地說,環境因素的影響就是比遺傳因素大。事實上,如果未來環境因素的波動程度變小,很可能遺傳因素就顯得更為重要。
數據的情況千差萬別,變數的相對重要性也可能完全不同,但都符合當時的實際情況。

相關詞條

熱門詞條

聯絡我們