《統計學:從數據到結論》(第四版)是2013年3月中國統計出版社出版的圖書,吳喜之編著。
基本介紹
- 書名:統計學:從數據到結論(第四版)
- 作者:吳喜之
- ISBN:978-7-5037-6789-0
- 出版社:中國統計出版社
- 出版時間:2013-03-13
基本信息,內容介紹,目錄,
基本信息
作者:吳喜之編著
出版社:中國統計出版社
ISBN:978-7-5037-6789-0
出版時間:2013-03-13
內容介紹
本書前三版作為全國統計教材編審委員會規劃教材,收到良好的反響。第四版在前三版基礎上又做了一定的增刪。本書編寫的目的是希望讀者在學習之後,能夠知道實際中哪些是統計問題,最好能夠自己解決一部分統計問題,即使不能解決也知道能夠在哪裡查到答案和向誰請教。通過學習獲得解決和處理問題的能力。第四版採用免費的自由軟體R,由淺入深地把統計最基本和最有用的部分在這么一本不厚的教科書中完整地介紹給讀者,而且讓讀者可以邊學習,邊著手用統計軟體處理數據。不僅可供沒有學過機率論和數理統計的非統計專業的本科生和研究生使用,也可以供統計專業的本科生作為理解統計本來含義的教材使用(以代替不能滿足需要的“描述統計學”等類課程),它還可以為各領域的廣大實際工作者作為套用各種統計方法的參考書。前面的章節是對統計基本概念的介紹。後面的部分介紹更有針對性的一些統計模型和方法。
目錄
第一章一些基本概念
1.1統計是什麼?
1.2現實中的隨機性和規律性,機率和機會
1.3變數和數據
1.4變數之間的關係
1.4.1定量變數間的關係
1.4.2定性變數間的關係
1.4.3定性和定量變數間的混和關係
1.5統計、計算機與統計軟體
1.6小結
1.7習題
第二章數據的收集
2.1數據是怎樣得到的?
2.2個體、總體和樣本
2.3收集數據時的誤差
2.4抽樣調查和一些常用的方法
2.5計算機中常用的數據形式
2.6小結
2.7習題
第三章數據的描述
3.1如何用圖來表示數據?
3.1.1定量變數的圖表示:直方圖、盒形圖、莖葉圖和散點圖
3.1.2定性變數的圖表示:餅圖和條形圖
3.1.3其他圖描述法
3.2如何用少量數字來概括數據?
3.2.1數據的“位置”
3.2.2數據的“尺度”
3.2.3數據的標準得分
3.3小結
3.3.1本章的概括和公式
3.3.2R語句的說明
3.4習題
第四章機會的度量:機率和分布
4.1得到機率的幾種途徑
4.2機率的運算
4.3變數的分布
4.3.1離散隨機變數的分布
4.3.2連續隨機變數的分布
4.3.3累積分布函式
4.4抽樣分布、中心極限定理
4.5用小機率事件進行判斷
4.6小結
4.6.1本章的概括和公式
4.6.2本章例題和R語句說明
4.6.3生成本章圖形的R代碼
4.7習題
1.1統計是什麼?
1.2現實中的隨機性和規律性,機率和機會
1.3變數和數據
1.4變數之間的關係
1.4.1定量變數間的關係
1.4.2定性變數間的關係
1.4.3定性和定量變數間的混和關係
1.5統計、計算機與統計軟體
1.6小結
1.7習題
第二章數據的收集
2.1數據是怎樣得到的?
2.2個體、總體和樣本
2.3收集數據時的誤差
2.4抽樣調查和一些常用的方法
2.5計算機中常用的數據形式
2.6小結
2.7習題
第三章數據的描述
3.1如何用圖來表示數據?
3.1.1定量變數的圖表示:直方圖、盒形圖、莖葉圖和散點圖
3.1.2定性變數的圖表示:餅圖和條形圖
3.1.3其他圖描述法
3.2如何用少量數字來概括數據?
3.2.1數據的“位置”
3.2.2數據的“尺度”
3.2.3數據的標準得分
3.3小結
3.3.1本章的概括和公式
3.3.2R語句的說明
3.4習題
第四章機會的度量:機率和分布
4.1得到機率的幾種途徑
4.2機率的運算
4.3變數的分布
4.3.1離散隨機變數的分布
4.3.2連續隨機變數的分布
4.3.3累積分布函式
4.4抽樣分布、中心極限定理
4.5用小機率事件進行判斷
4.6小結
4.6.1本章的概括和公式
4.6.2本章例題和R語句說明
4.6.3生成本章圖形的R代碼
4.7習題
第五章簡單統計推斷:總體參數的估計
5.1用估計量估計總體參數
5.2點估計
5.3區間估計
5.3.1一個正態總體均值μ的區間估計
5.3.2兩個正態總體均值之差μ1-μ2的區間估計
5.3.3總體比例(Bernoulli試驗成功機率)p的區間估計
5.3.4總體比例(Bernoulli試驗成功機率)之差p1-p2的區間估計
5.4關於置信區間的注意點
5.5小結
5.5.1本章的概括和公式
5.5.2R語句的說明
5.6習題
第六章簡單統計推斷:總體參數的假設檢驗
6.1假設檢驗的過程和邏輯
6.1.1假設檢驗的過程和邏輯
6.1.2假設檢驗在前計算機時代發展的一些概念和步驟
6.2對於正態總體均值的檢驗
6.2.1根據一個樣本對其總體均值大小進行檢驗
6.2.2根據來自兩個總體的獨立樣本對其總體均值的檢驗
6.2.3成對樣本的問題
6.2.4關於正態性檢驗的問題
6.3對於比例的檢驗
6.3.1對於總體比例的檢驗
6.3.2對於連續變數比例的檢驗
6.4非參數檢驗
6.4.1關於非參數檢驗的一些常識
6.4.2關於單樣本位置的符號檢驗
6.4.3關於單樣本位置的Wilcoxon符號秩檢驗
6.4.4關於隨機性的遊程檢驗(runstest)
6.4.5比較兩獨立總體中位數的Wilcoxon(MannWhitney)秩和檢驗
6.5從一個例子說明“接受零假設”的說法不妥
6.6小結
6.6.1本章的概括和公式
6.6.2R語句的說明
6.7習題
第七章變數之間的關係;回歸和分類
7.1問題的提出
7.2定量變數的線性相關
7.3經典回歸和分類
7.3.1一個數量自變數的線性回歸
7.3.2多個數量自變數的線性回歸
7.3.3自變數中有定性變數的線性回歸
7.3.4Logistic回歸
7.3.5自變數為數量變數時的分類:經典判別分析
7.4現代分類和回歸:機器學習方法
7.4.1決策樹
7.4.2關於組合算法
7.4.3Boosting
7.4.4隨機森林
7.4.5支持向量機
7.4.6交叉驗證比較各個模型
7.5頻數或列聯表數據
7.5.1列聯表數據及二維列聯表的獨立性檢驗
7.5.2高維列聯表和多項分布對數線性模型
7.5.3Poisson對數線性模型
7.6小結
7.6.1本章的概括和公式
7.6.2R語句的說明
7.7習題
第八章多元分析
8.1尋找多個變數的代表:主成分分析和因子分析
8.1.1主成分分析
8.1.2因子分析
8.1.3因子分析和主成分分析的一些注意事項
8.2把對象分類:聚類分析
8.2.1如何度量距離遠近
8.2.2事先要確定分多少類:k均值聚類
8.2.3事先不用確定分多少類:分層聚類
8.2.4聚類要注意的問題
8.3兩組變數之間的相關:典型相關分析
8.3.1兩組變數的相關問題
8.3.2典型相關分析
8.4列聯表行變數和列變數的關係:對應分析
8.5小結
8.5.1本章的概括和公式
8.5.2R語句的說明
8.6習題
第九章隨時間變化的對象:時間序列分析
9.1時間序列的組成部分
9.2指數平滑
9.3Box-Jenkins方法:ARIMA模型
9.3.1ARIMA模型介紹
9.3.2ARMA模型識別和估計
9.3.3用ARIMA模型擬合
9.4小結
9.4.1本章的概括和公式
9.5習題
第十章生存分析簡介
10.1對生命數據的簡單描述
10.2Cox比例危險模型
10.3小結
10.3.1本章的概括和公式
10.3.2R語句的說明
10.4習題
第十一章指數簡介
11.1指數漫談
11.2價格指數
11.3數量指數(生活標準指數)
11.4總花費指數
11.5一兩個常見的經濟指數
11.6小結
附錄A練習:熟練使用R軟體
5.1用估計量估計總體參數
5.2點估計
5.3區間估計
5.3.1一個正態總體均值μ的區間估計
5.3.2兩個正態總體均值之差μ1-μ2的區間估計
5.3.3總體比例(Bernoulli試驗成功機率)p的區間估計
5.3.4總體比例(Bernoulli試驗成功機率)之差p1-p2的區間估計
5.4關於置信區間的注意點
5.5小結
5.5.1本章的概括和公式
5.5.2R語句的說明
5.6習題
第六章簡單統計推斷:總體參數的假設檢驗
6.1假設檢驗的過程和邏輯
6.1.1假設檢驗的過程和邏輯
6.1.2假設檢驗在前計算機時代發展的一些概念和步驟
6.2對於正態總體均值的檢驗
6.2.1根據一個樣本對其總體均值大小進行檢驗
6.2.2根據來自兩個總體的獨立樣本對其總體均值的檢驗
6.2.3成對樣本的問題
6.2.4關於正態性檢驗的問題
6.3對於比例的檢驗
6.3.1對於總體比例的檢驗
6.3.2對於連續變數比例的檢驗
6.4非參數檢驗
6.4.1關於非參數檢驗的一些常識
6.4.2關於單樣本位置的符號檢驗
6.4.3關於單樣本位置的Wilcoxon符號秩檢驗
6.4.4關於隨機性的遊程檢驗(runstest)
6.4.5比較兩獨立總體中位數的Wilcoxon(MannWhitney)秩和檢驗
6.5從一個例子說明“接受零假設”的說法不妥
6.6小結
6.6.1本章的概括和公式
6.6.2R語句的說明
6.7習題
第七章變數之間的關係;回歸和分類
7.1問題的提出
7.2定量變數的線性相關
7.3經典回歸和分類
7.3.1一個數量自變數的線性回歸
7.3.2多個數量自變數的線性回歸
7.3.3自變數中有定性變數的線性回歸
7.3.4Logistic回歸
7.3.5自變數為數量變數時的分類:經典判別分析
7.4現代分類和回歸:機器學習方法
7.4.1決策樹
7.4.2關於組合算法
7.4.3Boosting
7.4.4隨機森林
7.4.5支持向量機
7.4.6交叉驗證比較各個模型
7.5頻數或列聯表數據
7.5.1列聯表數據及二維列聯表的獨立性檢驗
7.5.2高維列聯表和多項分布對數線性模型
7.5.3Poisson對數線性模型
7.6小結
7.6.1本章的概括和公式
7.6.2R語句的說明
7.7習題
第八章多元分析
8.1尋找多個變數的代表:主成分分析和因子分析
8.1.1主成分分析
8.1.2因子分析
8.1.3因子分析和主成分分析的一些注意事項
8.2把對象分類:聚類分析
8.2.1如何度量距離遠近
8.2.2事先要確定分多少類:k均值聚類
8.2.3事先不用確定分多少類:分層聚類
8.2.4聚類要注意的問題
8.3兩組變數之間的相關:典型相關分析
8.3.1兩組變數的相關問題
8.3.2典型相關分析
8.4列聯表行變數和列變數的關係:對應分析
8.5小結
8.5.1本章的概括和公式
8.5.2R語句的說明
8.6習題
第九章隨時間變化的對象:時間序列分析
9.1時間序列的組成部分
9.2指數平滑
9.3Box-Jenkins方法:ARIMA模型
9.3.1ARIMA模型介紹
9.3.2ARMA模型識別和估計
9.3.3用ARIMA模型擬合
9.4小結
9.4.1本章的概括和公式
9.5習題
第十章生存分析簡介
10.1對生命數據的簡單描述
10.2Cox比例危險模型
10.3小結
10.3.1本章的概括和公式
10.3.2R語句的說明
10.4習題
第十一章指數簡介
11.1指數漫談
11.2價格指數
11.3數量指數(生活標準指數)
11.4總花費指數
11.5一兩個常見的經濟指數
11.6小結
附錄A練習:熟練使用R軟體