《實驗數據分析(上冊)》是2012年科學出版社出版的圖書,作者是朱永生。
基本介紹
- 中文名:現代物理基礎從書45:實驗數據分析
- 出版社:科學出版社
- 頁數:399頁
- 開本:16
- 品牌:科學出版社
- 作者:朱永生
- 出版日期:2012年6月1日
- 語種:簡體中文
- ISBN:7030347315, 9787030347312
內容簡介,圖書目錄,文摘,
內容簡介
《現代物理基礎從書45:實驗數據分析(上冊)》介紹實驗和測量數據分析中涉及的機率和數理統計及相關的數學知識,內容包括機率論、經典數理統計、貝葉斯統計、蒙特卡羅方法、極小化方法和去彌散方法六個部分。特別討論了數據統計處理中的一些困難問題和近期國際上發展起來的新方法。書中分析了取自普通物理、核物理、粒子物理和工程技術問題的許多實例,注重物理問題與數學方法的結合,具體闡述了機率和數理統計及相關的數學方法在實際問題中的套用。書末附有詳盡的數理統計表,可供書中涉及的幾乎所有數據分析問題之需要,而無需查閱專門的數理統計表書籍。 《實驗數據分析(上冊)》可供實驗物理工作者和大專院校相關專業師生、理論物理研究人員、工程技術人員以及從事自然科學和社會科學的數據測量和分析研究人員參考。本書可供實驗物理工作者和大專院校相關專業師生、理論物理研究人員、工程技術人員以及從事自然科學和社會科學的數據測量和分析研究人員參考。
圖書目錄
前言
第1章機率論初步
1.1隨機試驗,隨機事件,樣本空間
1.2機率
1.3條件機率,獨立性
1.4機率計算舉例
1.5邊沿機率,全機率公式,貝葉斯公式
第2章隨機變數及其分布
2.1隨機變數
2.2隨機變數的分布
2.3隨機變數函式的分布
2.4隨機變數的數字特徵
2.5隨機變數的特徵函式
2.6離散隨機變數的機率母函式
第3章多維隨機變數及其分布
3.1二維隨機變數的分布,獨立性
3.2條件機率分布
3.3二維隨機變數的數字特徵
3.4二維隨機變數的函式的分布
3.5多維隨機變數,向量和矩陣記號
3.6多維隨機變數的聯合特徵函式
3.7多維隨機變數的函式的分布
3.8線性變換和正交變換
3.9誤差傳播公式
第4章一些重要的機率分布
4.1伯努利分布和二項分布
4.2多項分布
4.3泊松分布,泊松過程
4.4泊松分布與其他分布的相互聯繫
4.5複合泊松分布
4.6幾何分布,負二項分布,超幾何分布
4.7均勻分布
4.8指數分布
4.9伽馬分布
4.10貝塔分布
4.11常態分配
4.12二維常態分配
4.13多維常態分配
4.14對數常態分配
4.15柯西分布
4.16朗道分布
4.17X2分布
4.18t分布
4.19F分布
4.20實驗分布
4.20.1實驗分辨函式
4.20.2探測效率
4.20.3複合機率密度
第5章大數定律和中心極限定理
5.1大數定律
5.2中心極限定理
第6章子樣及其分布
6.1隨機子樣,子樣分布函式
6.2統計量及其數字特徵
6.3抽樣分布
6.3.1子樣平均值的分布
6.3.2服從x2分布的統計量,自由度
6.3.3服從t分布和F分布的統計量
6.3.4正態總體子樣偏度、子樣峰度、子樣相關係數的分布
6.4抽樣數據的圖形表示,頻率分布
6.4.1一維散點圖和直方圖,頻率分布
6.4.2二維散點圖和直方圖
第7章參數估計
7.1估計量,似然函式
7.2估計量的相合性
7.3估計量的無偏性
7.4估計量的有效性和最小方差
7.5估計量的充分性,信息
7.5.1充分統計量
7.5.2充分性與信息
7.6區間估計
7.6.1樞軸變數法
7.6.2大樣本法
7.7正態總體均值的置信區間
7.8正態總體方差的置信區間
7.9正態總體均值和方差的聯合置信域
第8章極大似然法
8.1極大似然原理
8.2正態總體參數的極大似然估計
8.3極大似然估計量的性質
8.3.1參數變換下的不變性
8.3.2相合性和無偏性
8.3.3充分性
8.3.4有效性
8.3.5唯一性
8.3.6漸近正態性
8.4極大似然估計量的方差
8.4.1方差估計的一般方法
8.4.2充分和有效估計量的方差公式
8.4.3大子樣情形下的方差公式
8.5極大似然估計及其誤差的圖像確定
8.5.1總體包含單個未知參數
8.5.2總體包含兩個未知參數
8.6利用似然函式作區間估計,似然區間
8.6.1單個參數的似然區間
8.6.2由巴特勒特函式求置信區間
8.6.3兩個參數的似然域
8.6.4多個參數的似然域
8.7極大似然法套用於直方圖數據
8.8極大似然法套用於多個實驗結果的合併
8.8.1正態型似然函式
8.8.2非正態型似然函式
8.9極大似然法套用於實驗測量數據
8.10有約束的極大似然估計
第9章最小二乘法
9.1最小二乘原理
9.2線性最小二乘估計
9.2.1正規方程
9.2.2線性最小二乘估計量的性質
9.2.3線性最小二乘估計舉例
9.2.4一般多項式和正交多項式擬合
9.3非線性最小二乘估計
9.4最小二乘擬合
9.4.1測量擬合值和殘差
9.4.2線性模型中σ2的估計
9.4.3正態性假設,自由度
9.4.4擬合優度
9.5最小二乘法套用於直方圖數據
9.6最小二乘法套用於實驗測量數據
9.7線性約束的線性最小二乘估計
9.8非線性約束的最小二乘估計
9.8.1拉格朗日乘子法
9.8.2誤差估計
9.8.3一般最小二乘擬合的自由度
9.9最小二乘法求置信區間
9.9.1單個參數的誤差和置信區間
9.9.2多個參數的誤差和置信域
9.10協方差矩陣未知的多個實驗結果的合併
第10章矩法,三種估計方法的比較
10.1簡單的矩法
10.2一般的矩法
10.3舉例
10.4矩法、極大似然法和最小二乘法的比較
10.4.1反質子極化實驗的模擬
10.4.2不同估計方法的套用
10.4.3討論
第11章小信號測量的區間估計
11.1經典方法
11.1.1正態總體
11.1.2泊松總體
11.2似然比順序求和方法
11.2.1泊松總體
11.2.2正態總體
11.3改進的似然比順序求和方法
11.4考慮系統誤差時泊松總體的區間估計
參考文獻
《現代物理基礎叢書》已出版書目
第1章機率論初步
1.1隨機試驗,隨機事件,樣本空間
1.2機率
1.3條件機率,獨立性
1.4機率計算舉例
1.5邊沿機率,全機率公式,貝葉斯公式
第2章隨機變數及其分布
2.1隨機變數
2.2隨機變數的分布
2.3隨機變數函式的分布
2.4隨機變數的數字特徵
2.5隨機變數的特徵函式
2.6離散隨機變數的機率母函式
第3章多維隨機變數及其分布
3.1二維隨機變數的分布,獨立性
3.2條件機率分布
3.3二維隨機變數的數字特徵
3.4二維隨機變數的函式的分布
3.5多維隨機變數,向量和矩陣記號
3.6多維隨機變數的聯合特徵函式
3.7多維隨機變數的函式的分布
3.8線性變換和正交變換
3.9誤差傳播公式
第4章一些重要的機率分布
4.1伯努利分布和二項分布
4.2多項分布
4.3泊松分布,泊松過程
4.4泊松分布與其他分布的相互聯繫
4.5複合泊松分布
4.6幾何分布,負二項分布,超幾何分布
4.7均勻分布
4.8指數分布
4.9伽馬分布
4.10貝塔分布
4.11常態分配
4.12二維常態分配
4.13多維常態分配
4.14對數常態分配
4.15柯西分布
4.16朗道分布
4.17X2分布
4.18t分布
4.19F分布
4.20實驗分布
4.20.1實驗分辨函式
4.20.2探測效率
4.20.3複合機率密度
第5章大數定律和中心極限定理
5.1大數定律
5.2中心極限定理
第6章子樣及其分布
6.1隨機子樣,子樣分布函式
6.2統計量及其數字特徵
6.3抽樣分布
6.3.1子樣平均值的分布
6.3.2服從x2分布的統計量,自由度
6.3.3服從t分布和F分布的統計量
6.3.4正態總體子樣偏度、子樣峰度、子樣相關係數的分布
6.4抽樣數據的圖形表示,頻率分布
6.4.1一維散點圖和直方圖,頻率分布
6.4.2二維散點圖和直方圖
第7章參數估計
7.1估計量,似然函式
7.2估計量的相合性
7.3估計量的無偏性
7.4估計量的有效性和最小方差
7.5估計量的充分性,信息
7.5.1充分統計量
7.5.2充分性與信息
7.6區間估計
7.6.1樞軸變數法
7.6.2大樣本法
7.7正態總體均值的置信區間
7.8正態總體方差的置信區間
7.9正態總體均值和方差的聯合置信域
第8章極大似然法
8.1極大似然原理
8.2正態總體參數的極大似然估計
8.3極大似然估計量的性質
8.3.1參數變換下的不變性
8.3.2相合性和無偏性
8.3.3充分性
8.3.4有效性
8.3.5唯一性
8.3.6漸近正態性
8.4極大似然估計量的方差
8.4.1方差估計的一般方法
8.4.2充分和有效估計量的方差公式
8.4.3大子樣情形下的方差公式
8.5極大似然估計及其誤差的圖像確定
8.5.1總體包含單個未知參數
8.5.2總體包含兩個未知參數
8.6利用似然函式作區間估計,似然區間
8.6.1單個參數的似然區間
8.6.2由巴特勒特函式求置信區間
8.6.3兩個參數的似然域
8.6.4多個參數的似然域
8.7極大似然法套用於直方圖數據
8.8極大似然法套用於多個實驗結果的合併
8.8.1正態型似然函式
8.8.2非正態型似然函式
8.9極大似然法套用於實驗測量數據
8.10有約束的極大似然估計
第9章最小二乘法
9.1最小二乘原理
9.2線性最小二乘估計
9.2.1正規方程
9.2.2線性最小二乘估計量的性質
9.2.3線性最小二乘估計舉例
9.2.4一般多項式和正交多項式擬合
9.3非線性最小二乘估計
9.4最小二乘擬合
9.4.1測量擬合值和殘差
9.4.2線性模型中σ2的估計
9.4.3正態性假設,自由度
9.4.4擬合優度
9.5最小二乘法套用於直方圖數據
9.6最小二乘法套用於實驗測量數據
9.7線性約束的線性最小二乘估計
9.8非線性約束的最小二乘估計
9.8.1拉格朗日乘子法
9.8.2誤差估計
9.8.3一般最小二乘擬合的自由度
9.9最小二乘法求置信區間
9.9.1單個參數的誤差和置信區間
9.9.2多個參數的誤差和置信域
9.10協方差矩陣未知的多個實驗結果的合併
第10章矩法,三種估計方法的比較
10.1簡單的矩法
10.2一般的矩法
10.3舉例
10.4矩法、極大似然法和最小二乘法的比較
10.4.1反質子極化實驗的模擬
10.4.2不同估計方法的套用
10.4.3討論
第11章小信號測量的區間估計
11.1經典方法
11.1.1正態總體
11.1.2泊松總體
11.2似然比順序求和方法
11.2.1泊松總體
11.2.2正態總體
11.3改進的似然比順序求和方法
11.4考慮系統誤差時泊松總體的區間估計
參考文獻
《現代物理基礎叢書》已出版書目
文摘
第1 章機率論初步
1.1 隨機試驗,隨機事件,樣本空間
自然界存在著在一定條件下必然發生的現象。例如,兩個點電荷之間必定有相互作用力;高處的重物必定落向地面;水在一個大氣壓、100±C條件下必然沸騰,等等。這些現象稱為必然現象,它們的過程和後果是完全確定的,可以唯一地用一定的物理規律給以精確的描述。如點電荷之間的作用力服從庫侖定律,真空中物體的下落過程服從自由落體規律。
但自然界還存在另一類性質不同的現象,即使在完全相同的條件下對同一事物做多次測量或試驗,我們發現,試驗的結果並不一樣,一次單獨的試驗結果是不確定的,因此無法用任何數學公式計算出來。儘管每次試驗的結果看來似乎雜亂無章,但如做大量重複試驗,其結果卻呈現出某種規律性。我們來舉例說明。
投擲一枚均勻硬幣,其結果或者是正面朝上,或者是反面朝上。我們無法預言任何一次投擲中硬幣的哪一面朝上,但當投擲次數很多時,則正面朝上的次數約占1/2。
擲一個骰子,骰子的六個面分別刻有1,2,3,4,5,6等數字。每扔一次得到的點數是1/6中的哪一個數無法確定,但在大量投擲中,每一個點數的出現次數占總投擲數的1/6左右。
上述兩例的共同特徵是:個別試驗中的結果是不確定的,但大量重複試驗的結果會出現某種規律性。這類現象稱為隨機現象,這種規律性稱為統計規律性。揭示隨機現象的統計規律性的數學工具是機率論和數理統計。
扔骰子、扔硬幣的試驗有以下特性:試驗可以在相同條件下重複進行;試驗的結果不止一個,但所有結果都已明確地知道;每次試驗結果究竟是其中的哪一種則無法確定。具有這些性質的試驗稱為隨機試驗,簡稱試驗。將某種隨機試驗E重複進行n次,若各次試驗的結果互不影響,則稱n次試驗是互相獨立的。隨機試驗中可能出現的各種結果稱為隨機事件,簡稱事件。隨機試驗中每一種可能出現的結果是最簡單、最基本的事件,稱為基本事件。如扔骰子試驗中,每扔一次即是一次隨機試驗;\出現1點、\出現2點\出現6點是6個基本事件;\出現大於4的點、\出現偶數點是事件,但不是基本事件。試驗中必定發生的事件叫必然事件,不會發生的事件叫不可能事件。如\點數大於0是必然事件,\點數大於6是不可能事件。
隨機試驗E的所有基本事件組成的集合稱為E的樣本空間,記為S。S的元素是試驗E的所有基本事件,元素也稱樣本點。例如,扔硬幣和扔骰子試驗的樣本空間可記為S硬幣:f正面,反面g,S骰子:f1,2,3,4,5,6g。引入樣本空間的概念後,可以看到事件是樣本空間的一個子空間或子集。如\點數大於4是子集f5,6g,\偶數點是子集f2,4,6g。必然事件就是樣本空間S的全域;不可能事件是空集,用?表示。
現在我們來規定事件之間的關係及運算。設隨機試驗E的樣本空間為S,事件A,B,Ak(k=1,2,¢¢¢)為E的事件,我們用下述符號表示它們之間不同的關係。
A?B(或B?A)稱為事件B包含事件A,表示事件A的發生必然導致事件B的發生。這可用圖1.1加以說明,圖中長方形表示樣本空間S,圓A和圓B表示事件A和B的子集,子集A含於子集B內。
A=B稱為事件A與事件B相等,表示事件A包含事件B且事件B包含A,即B?A且A?B。
A[B稱為事件A與事件B之和,表示事件A或事件B至少有一個發生。
圖1.3A\B
圖1.2中斜線部分表示A[B。
類似地,A1[A2[¢¢¢[An[¢¢¢′1[k=1
Ak稱為A1,A2,¢¢¢之和,表示這些事件中至少有一個發生。
A\B或AB稱為事件A與事件B之積,表示事件A和事件B同時發生。圖1.3中斜線部分表示AB。
類似地,A1\A2\¢¢¢\An\¢¢¢′1\k=1Ak為事件A1,A2,¢¢¢之積,表示這些事件同時發生。
A?B稱為事件A與事件B之差,表示事件A發生而事件B不發生。
A?B如圖1.4中斜線部分所示。
AB=?稱為事件A與事件B互不相容,表示事件A與事件B不可能同時發生。圖1.5是互不相容的兩個事件A和B的圖示。基本事件之間是互不相容的。
A=1B或B=A1稱事件A與事件B互逆,或A,B互為對立事件,表示事件A和B中必有且僅有一個發生,也即A[B=S,AB=?。圖1.6中斜線部分為事件B的對立事件A=1B。由此規定可知,互逆事件一定互不相容。
樣本空間的劃分是十分有用的一個概念。設S為隨機試驗E的樣本空間,E的一組事件B1,B2,¢¢¢,Bn兩兩互不相容,且B1,B2,¢¢¢,Bn之和等於樣本空間的全域,即滿足8<:BiBj=?;i6=j;i;j=1;2;¢¢¢;n;B1[B2[¢¢¢[Bn=S;(1.1.1)
則稱B1,B2,¢¢¢,Bn為樣本空間S的一個劃分。圖1.7是樣本空間S的一個劃分的圖示。顯然樣本空間的所有元素構成它的一個劃分;對立事件也是樣本空間的一個劃分。
以扔骰子為例,骰子面朝上的點數作為隨機試驗,其樣本空間是S=f1;2;3;4;5;6g。設一組事件B1=f1;2g;B2=f3;4g;B3=f5;g,則B1;B2;B3構成S的一個劃分。事件組C1=f1;2g;C2=f2;3g;C3=f4;5g不是S的劃分,它不滿足式(1.1.1)的要求。
圖1.7 樣本空間的劃分
1.2 機率
所謂隨機事件的機率,指的是隨機試驗中該隨機事件發生的可能性大小的數值表示。歷史上出現過幾種不同的機率模型。
(1)統計(頻率)概型
重複進行一種隨機試驗,共作了N次,其中事件A出現n次(稱為事件A的頻數),比值n/N稱為事件A在N次試驗中出現的頻率。隨著試驗次數N的增加,頻率n/N的值將逐漸穩定於某個常數。事件A的機率定義為試驗次數N趨向無窮大的極限情形下的頻率:
P(A)=limN!1nN:(1.2.1)
這樣定義的機率稱為統計機率或頻率機率。由以上定義可見,事件的機率是隨機試驗中該事件發生的可能性大小的數量表述。
機率的上述定義相當直觀,但數學上不夠嚴格,而且無窮多次試驗事實上無法實行。
(2)古典概型
假設一種隨機試驗的樣本空間包含有限個元素,每個基本事件出現的可能性相等。即隨機試驗的樣本空間為S=fe1;e2;¢¢¢;eng;每個基本事件的機率相等,則有
1=P(S)=nXi=1P(ei)=nP(ei);
即
P(ei)=1n;i=1;2;¢¢¢;n:(1.2.2)
若事件A包含k個基本事件,則事件A的機率為
P(A)=k=n:(1.2.3)
這樣的機率模型稱為等可能概型或古典概型,前面提到的擲硬幣和扔骰子試驗都屬於古典概型。
(3)幾何概型
古典概型要求隨機試驗的樣本空間只包含有限個可能性相等的元素(或稱樣本點),若隨機試驗的樣本空間包含無限個可能性相等的樣本點,則不能按古典概型計算,而需要用幾何概型求解。設隨機試驗E的樣本空間S可用m(m=1;2;¢¢¢)維空間中的一有界區域-表示,其樣本點具有均勻分布性質(類似於古典機率中基本事件的等可能性),事件A(A?S)發生的可能性用區域!A表示,則事件A發生的機率為
P(A)=!A-;(1.2.4)
稱為幾何機率。它可以套用於無限可列個元素、甚至無限不可列個元素的情形(含義見下文)。
機率的上述模型,每種定義都是針對不同的隨機試驗而設計的,都很淺顯直觀,但都存在一定的局限性,數學上也不夠嚴密。1933年前蘇聯科學家柯爾莫哥洛夫綜合了前人的成果,提出了機率的公理化定義,從此,機率論才成為一個嚴密的數學分支。
機率的公理化定義可簡述如下
設S為一隨機試驗E的樣本空間,對於E的任一事件A,滿足如下條件的一個非負實函式P(A)稱為事件A的機率:
(1)06P(A)61,對一切A?S。(1.2.5)
(2)P(S)=1:(1.2.6)
(3)對兩兩不相容的事件Ak(k=1;2;¢¢¢)有
P(A1[A2[¢¢¢[An)=nXk=1P(Ak)(1.2.7)
或
P(A1[A2[¢¢¢[An[¢¢¢)=1Xk=1P(Ak):(1.2.8)
式(1.2.7)和式(1.2.8)分別稱為機率的有限可加性和可列可加性,它們分別適用於樣本空間含有有限個元素和無限可列個元素的情形。所謂無限可列個,指滿足兩個條件:有無限個元素,但可以與自然數列1,2,3,¢¢¢建立起一一對應的關係。式(1.2.6)也稱為樣本空間機率的歸一性,它表示隨機試驗整個樣本空間的機率和恆等於1。式(1.2.5)?式(1.2.8)表明了機率的定義可以簡單地歸結為:非負性、歸一性和可加性。
機率的公理化定義在數學上是嚴密的,但只規定了機率應滿足的條件,而沒有給出計算事件A的機率P(A)的方法,因而對同一個樣本空間,只要符合這三個公理化條件,機率可以有多種不同的定義。例如,前面討論過的統計機率、古典機率和幾何機率定義不同,但都符合機率的公理化定義的要求;在第13章貝葉斯統計中使用的貝葉斯機率,其定義與這三者皆不同,但同樣滿足公理化定義的要求。
在第5章中,大數定律將證明,在相當廣泛的情形中,當試驗次數N趨向無窮時,事件A的頻率n/N與其機率P(A)的嚴格定義值十分接近。在實際使用時,只要試驗次數N充分大,可用頻率n/N作為機率P(A)的近似值。
根據機率的定義,立即可推導出機率的如下性質:
(1)若A,A1為一隨機試驗的互逆事件,則有
P(A)+P(A1)=1:(1.2.9)
(2)不可能事件的機率為0,即
P(?)=0:(1.2.10)
(3)若事件A包含事件B,則
P(A)>P(B):(1.2.11)
(4)若A1;¢¢¢;An為一隨機試驗樣本空間S的一個劃分,則由式(1.2.6)和式
(1.2.7)立即得到
nXi=1
P(Ai)=1;(1.2.12)
樣本空間的所有基本事件的機率和等於1。式(1.2.9)可視為本式的特例。
(5)若A?B,則
P(A?B)=P(A)?P(B):(1.2.13)
(6)P(A[B)=P(A)+P(B)?P(AB):(1.2.14)
由圖1.2和圖1.3可知,A[B=A+B?AB,故得上式。該公式也稱為機率的加法定理。推廣到n個事件的一般情況,設A1;A2;¢¢¢;An是隨機試驗E的n個事件,則有
P(A1[A2[A3)=P(A1)+P(A2)+P(A3)?P(A1A2)?P(A2A3)?P(A1A3)+P(A1A2A3):(1.2.15)
1.1 隨機試驗,隨機事件,樣本空間
自然界存在著在一定條件下必然發生的現象。例如,兩個點電荷之間必定有相互作用力;高處的重物必定落向地面;水在一個大氣壓、100±C條件下必然沸騰,等等。這些現象稱為必然現象,它們的過程和後果是完全確定的,可以唯一地用一定的物理規律給以精確的描述。如點電荷之間的作用力服從庫侖定律,真空中物體的下落過程服從自由落體規律。
但自然界還存在另一類性質不同的現象,即使在完全相同的條件下對同一事物做多次測量或試驗,我們發現,試驗的結果並不一樣,一次單獨的試驗結果是不確定的,因此無法用任何數學公式計算出來。儘管每次試驗的結果看來似乎雜亂無章,但如做大量重複試驗,其結果卻呈現出某種規律性。我們來舉例說明。
投擲一枚均勻硬幣,其結果或者是正面朝上,或者是反面朝上。我們無法預言任何一次投擲中硬幣的哪一面朝上,但當投擲次數很多時,則正面朝上的次數約占1/2。
擲一個骰子,骰子的六個面分別刻有1,2,3,4,5,6等數字。每扔一次得到的點數是1/6中的哪一個數無法確定,但在大量投擲中,每一個點數的出現次數占總投擲數的1/6左右。
上述兩例的共同特徵是:個別試驗中的結果是不確定的,但大量重複試驗的結果會出現某種規律性。這類現象稱為隨機現象,這種規律性稱為統計規律性。揭示隨機現象的統計規律性的數學工具是機率論和數理統計。
扔骰子、扔硬幣的試驗有以下特性:試驗可以在相同條件下重複進行;試驗的結果不止一個,但所有結果都已明確地知道;每次試驗結果究竟是其中的哪一種則無法確定。具有這些性質的試驗稱為隨機試驗,簡稱試驗。將某種隨機試驗E重複進行n次,若各次試驗的結果互不影響,則稱n次試驗是互相獨立的。隨機試驗中可能出現的各種結果稱為隨機事件,簡稱事件。隨機試驗中每一種可能出現的結果是最簡單、最基本的事件,稱為基本事件。如扔骰子試驗中,每扔一次即是一次隨機試驗;\出現1點、\出現2點\出現6點是6個基本事件;\出現大於4的點、\出現偶數點是事件,但不是基本事件。試驗中必定發生的事件叫必然事件,不會發生的事件叫不可能事件。如\點數大於0是必然事件,\點數大於6是不可能事件。
隨機試驗E的所有基本事件組成的集合稱為E的樣本空間,記為S。S的元素是試驗E的所有基本事件,元素也稱樣本點。例如,扔硬幣和扔骰子試驗的樣本空間可記為S硬幣:f正面,反面g,S骰子:f1,2,3,4,5,6g。引入樣本空間的概念後,可以看到事件是樣本空間的一個子空間或子集。如\點數大於4是子集f5,6g,\偶數點是子集f2,4,6g。必然事件就是樣本空間S的全域;不可能事件是空集,用?表示。
現在我們來規定事件之間的關係及運算。設隨機試驗E的樣本空間為S,事件A,B,Ak(k=1,2,¢¢¢)為E的事件,我們用下述符號表示它們之間不同的關係。
A?B(或B?A)稱為事件B包含事件A,表示事件A的發生必然導致事件B的發生。這可用圖1.1加以說明,圖中長方形表示樣本空間S,圓A和圓B表示事件A和B的子集,子集A含於子集B內。
A=B稱為事件A與事件B相等,表示事件A包含事件B且事件B包含A,即B?A且A?B。
A[B稱為事件A與事件B之和,表示事件A或事件B至少有一個發生。
圖1.3A\B
圖1.2中斜線部分表示A[B。
類似地,A1[A2[¢¢¢[An[¢¢¢′1[k=1
Ak稱為A1,A2,¢¢¢之和,表示這些事件中至少有一個發生。
A\B或AB稱為事件A與事件B之積,表示事件A和事件B同時發生。圖1.3中斜線部分表示AB。
類似地,A1\A2\¢¢¢\An\¢¢¢′1\k=1Ak為事件A1,A2,¢¢¢之積,表示這些事件同時發生。
A?B稱為事件A與事件B之差,表示事件A發生而事件B不發生。
A?B如圖1.4中斜線部分所示。
AB=?稱為事件A與事件B互不相容,表示事件A與事件B不可能同時發生。圖1.5是互不相容的兩個事件A和B的圖示。基本事件之間是互不相容的。
A=1B或B=A1稱事件A與事件B互逆,或A,B互為對立事件,表示事件A和B中必有且僅有一個發生,也即A[B=S,AB=?。圖1.6中斜線部分為事件B的對立事件A=1B。由此規定可知,互逆事件一定互不相容。
樣本空間的劃分是十分有用的一個概念。設S為隨機試驗E的樣本空間,E的一組事件B1,B2,¢¢¢,Bn兩兩互不相容,且B1,B2,¢¢¢,Bn之和等於樣本空間的全域,即滿足8<:BiBj=?;i6=j;i;j=1;2;¢¢¢;n;B1[B2[¢¢¢[Bn=S;(1.1.1)
則稱B1,B2,¢¢¢,Bn為樣本空間S的一個劃分。圖1.7是樣本空間S的一個劃分的圖示。顯然樣本空間的所有元素構成它的一個劃分;對立事件也是樣本空間的一個劃分。
以扔骰子為例,骰子面朝上的點數作為隨機試驗,其樣本空間是S=f1;2;3;4;5;6g。設一組事件B1=f1;2g;B2=f3;4g;B3=f5;g,則B1;B2;B3構成S的一個劃分。事件組C1=f1;2g;C2=f2;3g;C3=f4;5g不是S的劃分,它不滿足式(1.1.1)的要求。
圖1.7 樣本空間的劃分
1.2 機率
所謂隨機事件的機率,指的是隨機試驗中該隨機事件發生的可能性大小的數值表示。歷史上出現過幾種不同的機率模型。
(1)統計(頻率)概型
重複進行一種隨機試驗,共作了N次,其中事件A出現n次(稱為事件A的頻數),比值n/N稱為事件A在N次試驗中出現的頻率。隨著試驗次數N的增加,頻率n/N的值將逐漸穩定於某個常數。事件A的機率定義為試驗次數N趨向無窮大的極限情形下的頻率:
P(A)=limN!1nN:(1.2.1)
這樣定義的機率稱為統計機率或頻率機率。由以上定義可見,事件的機率是隨機試驗中該事件發生的可能性大小的數量表述。
機率的上述定義相當直觀,但數學上不夠嚴格,而且無窮多次試驗事實上無法實行。
(2)古典概型
假設一種隨機試驗的樣本空間包含有限個元素,每個基本事件出現的可能性相等。即隨機試驗的樣本空間為S=fe1;e2;¢¢¢;eng;每個基本事件的機率相等,則有
1=P(S)=nXi=1P(ei)=nP(ei);
即
P(ei)=1n;i=1;2;¢¢¢;n:(1.2.2)
若事件A包含k個基本事件,則事件A的機率為
P(A)=k=n:(1.2.3)
這樣的機率模型稱為等可能概型或古典概型,前面提到的擲硬幣和扔骰子試驗都屬於古典概型。
(3)幾何概型
古典概型要求隨機試驗的樣本空間只包含有限個可能性相等的元素(或稱樣本點),若隨機試驗的樣本空間包含無限個可能性相等的樣本點,則不能按古典概型計算,而需要用幾何概型求解。設隨機試驗E的樣本空間S可用m(m=1;2;¢¢¢)維空間中的一有界區域-表示,其樣本點具有均勻分布性質(類似於古典機率中基本事件的等可能性),事件A(A?S)發生的可能性用區域!A表示,則事件A發生的機率為
P(A)=!A-;(1.2.4)
稱為幾何機率。它可以套用於無限可列個元素、甚至無限不可列個元素的情形(含義見下文)。
機率的上述模型,每種定義都是針對不同的隨機試驗而設計的,都很淺顯直觀,但都存在一定的局限性,數學上也不夠嚴密。1933年前蘇聯科學家柯爾莫哥洛夫綜合了前人的成果,提出了機率的公理化定義,從此,機率論才成為一個嚴密的數學分支。
機率的公理化定義可簡述如下
設S為一隨機試驗E的樣本空間,對於E的任一事件A,滿足如下條件的一個非負實函式P(A)稱為事件A的機率:
(1)06P(A)61,對一切A?S。(1.2.5)
(2)P(S)=1:(1.2.6)
(3)對兩兩不相容的事件Ak(k=1;2;¢¢¢)有
P(A1[A2[¢¢¢[An)=nXk=1P(Ak)(1.2.7)
或
P(A1[A2[¢¢¢[An[¢¢¢)=1Xk=1P(Ak):(1.2.8)
式(1.2.7)和式(1.2.8)分別稱為機率的有限可加性和可列可加性,它們分別適用於樣本空間含有有限個元素和無限可列個元素的情形。所謂無限可列個,指滿足兩個條件:有無限個元素,但可以與自然數列1,2,3,¢¢¢建立起一一對應的關係。式(1.2.6)也稱為樣本空間機率的歸一性,它表示隨機試驗整個樣本空間的機率和恆等於1。式(1.2.5)?式(1.2.8)表明了機率的定義可以簡單地歸結為:非負性、歸一性和可加性。
機率的公理化定義在數學上是嚴密的,但只規定了機率應滿足的條件,而沒有給出計算事件A的機率P(A)的方法,因而對同一個樣本空間,只要符合這三個公理化條件,機率可以有多種不同的定義。例如,前面討論過的統計機率、古典機率和幾何機率定義不同,但都符合機率的公理化定義的要求;在第13章貝葉斯統計中使用的貝葉斯機率,其定義與這三者皆不同,但同樣滿足公理化定義的要求。
在第5章中,大數定律將證明,在相當廣泛的情形中,當試驗次數N趨向無窮時,事件A的頻率n/N與其機率P(A)的嚴格定義值十分接近。在實際使用時,只要試驗次數N充分大,可用頻率n/N作為機率P(A)的近似值。
根據機率的定義,立即可推導出機率的如下性質:
(1)若A,A1為一隨機試驗的互逆事件,則有
P(A)+P(A1)=1:(1.2.9)
(2)不可能事件的機率為0,即
P(?)=0:(1.2.10)
(3)若事件A包含事件B,則
P(A)>P(B):(1.2.11)
(4)若A1;¢¢¢;An為一隨機試驗樣本空間S的一個劃分,則由式(1.2.6)和式
(1.2.7)立即得到
nXi=1
P(Ai)=1;(1.2.12)
樣本空間的所有基本事件的機率和等於1。式(1.2.9)可視為本式的特例。
(5)若A?B,則
P(A?B)=P(A)?P(B):(1.2.13)
(6)P(A[B)=P(A)+P(B)?P(AB):(1.2.14)
由圖1.2和圖1.3可知,A[B=A+B?AB,故得上式。該公式也稱為機率的加法定理。推廣到n個事件的一般情況,設A1;A2;¢¢¢;An是隨機試驗E的n個事件,則有
P(A1[A2[A3)=P(A1)+P(A2)+P(A3)?P(A1A2)?P(A2A3)?P(A1A3)+P(A1A2A3):(1.2.15)