多元統計分析

簡介

多元統計分析

multivariate statistical analysis

研究客觀事物中多個變數（或多個因素）之間相互依賴的統計規律性。它的重要基礎之一是多元正態分析。又稱多元分析。如果每個個體有多個觀測數據，或者從數學上說，如果個體的觀測數據能表為 P維歐幾里得空間的點，那么這樣的數據叫做多元數據，而分析多元數據的統計方法就叫做多元統計分析。它是數理統計學中的一個重要的分支學科。20世紀30年代，R.A.費希爾，H.霍特林，許寶碌以及S.N.羅伊等人作出了一系列奠基性的工作，使多元統計分析在理論上得到迅速發展。50年代中期，隨著電子計算機的發展和普及，多元統計分析在地質、氣象、生物、醫學、圖像處理、經濟分析等許多領域得到了廣泛的套用，同時也促進了理論的發展。各種統計軟體包如SAS，SPSS等，使實際工作者利用多元統計分析方法解決實際問題更簡單方便。重要的多元統計分析方法有：多重回歸分析（簡稱回歸分析）、判別分析、聚類分析、主成分分析、對應分析、因子分析、典型相關分析、多元方差分析等。

早在19世紀就出現了處理二維正態總體（見常態分配）的一些方法，但系統地處理多維機率分布總體的統計分析問題，則開始於20世紀。人們常把1928年維夏特分布的導出作為多元分析成為一個獨立學科的標誌。20世紀30年代，R.A.費希爾、H.霍特林、許寶祿以及S.N.羅伊等人作出了一系列奠基性的工作，使多元統計分析在理論上得到了迅速的進展。40年代，多元分析在心理、教育、生物等方面獲得了一些套用。由於套用時常需要大量的計算，加上第二次世界大戰的影響，使其發展停滯了相當長的時間。50年代中期，隨著電子計算機的發展和普及，它在地質、氣象、標準化、生物、圖像處理、經濟分析等許多領域得到了廣泛的套用，也促進了理論的發展。

多元分析發展的初期，主要討論如何把一元正態總體的統計理論和方法推廣到多元正態總體。多元正態總體的分布由兩組參數，即均值向量μ（見數學期望）和協方差矩陣（簡稱協差陣）∑ （見矩）所決定，記為Np(μ,∑)(p為分布的維數,故又稱p維常態分配或p 維正態總體)。設X1,X2,…,Xn為來自正態總體Np(μ,∑)的樣本，則μ和∑的無偏估計（見點估計）分別是

和