常態分配

歷史發展

常態分配概念是由法國數學家棣莫弗（Abraham de Moivre）於1733年首次提出的，後由德國數學家Gauss率先將其套用於天文學研究，故常態分配又叫高斯分布，高斯這項工作對後世的影響極大，他使常態分配同時有了“高簽婆紙希斯分布”的名稱，後世之所以多將最小二乘法的發明權歸之於他，也是出於這一工作。但德國10馬克的印有高斯頭像的鈔票，其上還印有常態分配的密度曲線。這傳達了一種想法：在高斯的一切科學貢獻中，其對人類文明影響最大者，就是這一項。在高斯剛作出這個發現之初，也許人們還只能從其理論的簡化上來評價其優越性，其全部影響還不能充分看出來。這要到20世紀正態小樣本理論充分發展起來以後。拉普拉斯很快得知高斯的工作，並馬上將其與他發現的中心極限定理聯繫起來，為此，他在即將發表的一篇文章（發表於1810年）上加上了一點補充，指出如若誤差可看成許多量的疊加，根據他的中心極限定理，誤差理應有高斯分布。這是歷史上第一次提到所謂“元誤差學說”——誤差仔多疊是由大量的、由種種原因產生的元誤差疊加而成。後來到1837年，海根（G.Hagen）在一篇論文中正式提出了這個學說。

其實，他提出的形式有相當大的局限性：海根把誤差構想成個數很多的、獨立同分布的“元誤差” 之和，每隻取兩值，其機率都是1/2，由此出發，按棣莫弗的中心極限定理，立即就得出誤差（近似地）服從常態分配。拉普拉斯所指出的這一點有重大的意義，在於他給誤差的正態理論一個更自然合理、更令人信服的解釋。因為，高斯的說法有一點循環論證的氣味：由於算術平均是優良的，推出誤差必須服從常態分配；反過來，由後一結論又推出算術平均及最小二乘估計的優良性，故必須認定這二者之一（算術平均的優良性，誤差的正態性）為出發點。但算術平均到底並沒有自行成立的理由，以它作為理論中一個預設的出汗付發點，終覺有其不足之處。拉普拉斯的理論把這斷裂的一環連線起來，使之成為一個和諧的整體，實有著極重大的意義。

定理

由於一般的正態總體其圖像不一定關於y軸對稱，對於任一正態總體，其取值小於x的機率。只要會用它求正態總體在某個特定區間的機率即可。

為了便於描述和套用，常將正態變數作數據轉換。將一般常態分配轉化成標準常態分配。

若

服從標準常態分配,通過查標準常態分配表就可以直接計算出原常態分配的機率值。故該變換被稱為標準化變換。（標準常態分配表：標準常態分配表中列出了標準正態曲線下從-∞到X（當前值）範圍內的面積比例。）

定義

一維常態分配

若隨機變數

服從一個位置參數為

、尺囑協腿度參數為

的機率分布，且其機率密度函式為

則這個隨機變數就稱為正態隨機變數，正態隨機變數服從的悼才踏煉分布就稱為常態分配，記作

，讀作

服從

，或

服從常態分配。

μ維隨機向量具有類似的機率規律時，稱此隨機向量遵從多維常態分配。多元常態分配有很好的性質，例如，多元常態分配的邊緣分布仍為常態分配，它經任何線性變換得到的隨機向量仍為多維常態分配，特別它的線性組合為一元常態分配。

本詞條的常態分配是一維常態分配，此外多維常態分配參見“二維常態分配”。

標準常態分配

當

時，常態分配就成為標準常態分配

性質

常態分配的一些性質：

（1）如果

且a與b是實數，那么

（參見期望值和方差）。

（2）如果

與

是統計獨立的正態隨機變數，那么：

它們的和也滿足常態分配

它們的差也滿足常態分配

U與V兩者是相連立牛互獨立的。（要求X與Y的方差相等）。

（3）如果

和

是獨立正態隨機變數，那么：

它們的積XY服從機率密度函式為p的分布

其中

是修正貝塞爾函式（modified Bessel function）

它們的比符合柯西分布，滿足

（4）如果

為獨立標準正態隨機變數，那么

服從自由度為n的卡方分布。

分布曲線

圖形特徵

集中性：正態曲線的高峰位於正中央，即均數所在的位置。

對稱性：正態曲線以均數為中心，左右對稱，曲線兩端永遠不與橫軸相交。

均勻變動性：正態曲線由均數所在處開始，分別向左右兩側逐漸均勻下降。

曲線與橫軸間的面積總等於1，相當於機率密度函式的函式從正無窮到負無窮積分的機率為1。即頻率的總和為100%。

關於μ對稱，並在μ處取最大值，在正（負）無窮遠處取值為0，在μ±σ處有拐點，形狀呈現中間高兩邊低，常態分配的機率密度函式曲線呈鐘形，因此人們又經常稱之為鐘形曲線。

參數含義

常態分配有兩個參數，即期望（均數）μ和標準差σ，σ為方差。

常態分配具有兩個參數μ和σ^2的連續型隨機變數的分布，第一參說檔局數μ是服從常態分配的隨機變數的均值，第二個參數σ^2是此隨機變數的方差，所以常態分配記作N（μ,σ）。

μ是常態分配的位置參數，描述常態分配的集中趨勢位置。機率規律為取與μ鄰近的值的機率大，而取離μ越遠的值的機率越小。常態分配以X=μ為對稱軸，左右完全對稱。常態分配的期望、均數、中位數、眾數相同，均等於μ。

σ描述常態分配資料數據分布的離散程度，σ越大，數據分布越分散，σ越小，數據分布越集中。也稱為是常態分配的形狀參數，σ越大，曲線越扁平，反之，σ越小，曲線越瘦高。

面積分布

正態函式的不定積分是一個非初等函式，稱為誤差函式。

實際上誤差函式的導數是：

將正態函式換元，誤差函式和“正態函式的積分”的關係是：

1、實際工作中，正態曲線下橫軸上一定區間的面積（誤差函式上下限之差）反映該區間的例數占總例數的百分比，或變數值落在該區間的機率（機率分布）。

2、正態曲線下，要取到50%機率，橫軸半區間長度為0.67448975σ（該值無法用初等方法求解，是由疊代法取得的近似值。）

橫軸區間（μ-σ,μ+σ）內的面積為68.268949%。

橫軸區間（μ-2σ,μ+2σ）內的面積為95.449974%。

橫軸區間（μ-3σ,μ+3σ）內的面積為99.730020%。

“小機率事件”和假設檢驗的基本思想： “小機率事件”通常指發生的機率小於5%的事件，認為在一次試驗中該事件是幾乎不可能發生的。由此可見X落在（μ-3σ,μ+3σ）以外的機率小於千分之三，在實際問題中常認為相應的事件不會發生，基本上可以把區間（μ-3σ,μ+3σ）看作是隨機變數X實際可能的取值區間，這稱之為常態分配的“3σ”原則。而對於產量更大，試驗次數更多的大規模流水線產品，要達到“萬無一失”（99.99%）就要取到4σ（99.9936%），而要達到更高的水平，則需要取5σ~6σ長度的半區間，此時誤差大約是0.6ppm~0.002ppm，這是工業生產中提出的“六西格瑪（6σ）”原則（管理學書籍中提及的六西格瑪原則的要求是3.4ppm，這個機率值所對的分布大約在半區間長度4.5σ，這是考慮到系統誤差造成的均值偏移μ=1.5σ的情況）。

研究過程

概念及特徵：

一、常態分配的概念

由一般分布的頻數表資料所繪製的直方圖，圖⑴可以看出，高峰位於中部，左右兩側大致對稱。我們

常態分配研究圖1

分布 x+-s	身高範圍（cm）	實際分布人數	實際分布百分數（%）	理論分布（%）
X+-1s	168.69～176.71	67	67.00	68.27
X +-1.96s	164.84～180.56	95	95.00	95.00
X+-2.58s	162.35～183.05	99	99.00	99.00

參考值範圍（%）	單側	雙側
80	0.842	1.282
90	1.282	1.645
95	1.645	1.960
99	2.326	2.576

分布 x+-s	身高範圍（cm）	實際分布人數	實際分布百分數（%）	理論分布（%）
X+-1s	168.69～176.71	67	67.00	68.27
X +-1.96s	164.84～180.56	95	95.00	95.00
X+-2.58s	162.35～183.05	99	99.00	99.00

參考值範圍（%）	單側	雙側
80	0.842	1.282
90	1.282	1.645
95	1.645	1.960
99	2.326	2.576

常態分配

基本介紹

歷史發展

定理

定義

一維常態分配

標準常態分配

性質

分布曲線

圖形特徵

參數含義

面積分布

研究過程

曲線套用

綜述

頻數分布

綜合素質研究

醫學參考值

定義

一維常態分配

標準常態分配

性質

分布曲線

圖形特徵

參數含義

面積分布

研究過程

曲線套用

綜述

頻數分布

綜合素質研究

醫學參考值

相關詞條

熱門詞條