《缺失數據》是2018年格致出版社出版的圖書,作者是(美)保羅·D.埃里森(Paul D. Allison)。
基本介紹
- 書名:缺失數據
- 作者:(美)保羅·D.埃里森(Paul D. Allison)
- 出版社:格致出版社
- 出版時間:2018年6月1日
- 頁數:145 頁
- 開本:32 開
- 裝幀:平裝
- ISBN:9787543228672
《缺失數據》是2018年格致出版社出版的圖書,作者是(美)保羅·D.埃里森(Paul D. Allison)。
《缺失數據》是格致方法·定量研究方法叢書之一種。全書圍繞“缺失數據”這一主題,用大部分篇幅闡述了處理缺失數據問題的新策略。作者在缺失數據的條件下回顧最大似然估計,以一個經過仔細篩選的美國大專院校畢業率的數據為例,解釋了插補法的EM算法。隨後,作者解釋了多重插補方法,並討論了不可忽略的缺失數據。《...
第2章 試驗中的缺失數據 2.1 引言 2.2 完全數據的精確最小二乘解 2.3 帶缺失數據的正確最小二乘分析 2.4 填充最小二乘估計 2.5 Bartlett協方差分析方法 2.6 僅使用完全數據方法由協方差分析獲得缺失值的最小二乘估計 2.7 標準誤差和單自由度平方和正確最小二乘估計 2.8 多自由度的正確最小二乘...
《缺失數據》是2018年格致出版社出版的圖書,作者是(美)保羅·D.埃里森(Paul D. Allison)。內容簡介 社會科學研究中經常遇到樣本數據缺失的問題,以往研究者傾向於將這種缺失認定為符合完全隨機缺失的特性,但實際上這一假設並不一定能完全符合,在對這種數據缺失進行處理時,往往會出現刪除大量數據導致影響統計結果的...
1.1 缺失數據問題的回顧 1.2 缺失數據的模式和機制 1.2.1 缺失數據模式 1.2.2 缺失數據機制 1.3 數據示例 1.3.1 改善心情並促進合作的治療(IMPACT)的研究 1.3.2 美國阿爾茨海默病協調中心(NACC)最小數據集 1.3.3 美國阿爾茨海默病協調中心(NACC)統一數據集 1.3.4 路徑研究 1...
在數據庫中,稀疏數據是指在二維表中含有大量空值的數據;即稀疏數據是指,在數據集中絕大多數數值缺失或者為零的數據。稀疏數據絕對不是無用數據,只不過是信息不完全,通過適當的手段是可以挖掘出大量有用信息。定義 稀疏數據是指,數據框中絕大多數數值缺失或者為零的數據。在現代社會中,隨著信息的爆炸式增長,...
《缺失數據的統計處理》是2009年1月中國統計出版社出版的圖書,作者是金勇進、邵軍。內容簡介 本書的一個特點是內容儘量通俗和簡化。有關缺失數據問題研究的文獻很多,內容比較繁雜,閱讀這些文獻需要花費很多時間。本書將各類處理缺失數據的統計方法進行了概括和簡化,以通俗的表達方式展現給讀者,希望讀者能夠在很短時間...
《缺失數據的靈活填補方法(英文影印注釋版)》是2018年3月機械工業出版社出版的圖書,作者是[荷]史蒂夫·范·布倫。內容簡介 本書共分為三大部分:Ⅰ基礎篇、Ⅱ案例研究、Ⅲ延伸。這其中包含10個章節,作者結合眾多實驗中的例子,探討如何解決缺失數據的問題,此類問題廣泛存在於各個領域之中。書中算法結合統計軟體...
導言 社會調查、無回答與缺失數據 第1章 刪除法和單一插補法 1.1刪除法 1.1.1 列表刪除 1.1.2 成對刪除 1.2單一插補法 1.2.1 均值插補 1.2.2回歸插補 1.2.3 熱平台插補 1.2.4 冷平台插補 1.2.5 LOCF與BOCF法 第2章 多重插補法概述 2.1多重插補的基本原理 2.1.1 什麼是多重插補?2...
《缺失數據統計分析》是2005年3月中國統計出版社出版的圖書,作者是Roderick J.A.Little、Donald B.Rubin。內容簡介 本書是面對套用統計學家的,因此更強調例子,而不強調正則條件的精確敘述或定理的證明,但仍希望讀者熟悉基於似然的推斷的基本原則,在6.1節有點簡短的回顧。這本書也假定讀者了解完全數據分析的...
《缺失數據的模型檢驗及其套用》是2014年科學出版社出版的圖書,作者是許王莉。內容簡介 本書共分8章:第1章主要介紹數據的不同缺失機制;第2章介紹一些常見的檢驗方法;第3章介紹在數據不存在缺失的情況下,幾種常見模型的檢驗方法及其性質;第4章是關於在因變數缺失時,部分線性模型中非線性部分是否符合某類參數...
缺失數據和半參數模型均是當前國內外研究熱點問題之一.而正確的模型假定是統計推斷的基礎。如果模型假定錯誤,則可能會出現錯誤的統計分析結果。因此非常有必要進行模型檢驗工作。但是文獻中關於缺失數據的模型檢驗的相關研究非常少,另一方面,相比估計問題,實際工作者常用的CC方法在做模型檢驗時效果非常差。因此非常有必要...
《基於相似緊鄰的缺失數據填補關鍵技術研究》是依託清華大學,由宋韶旭擔任項目負責人的面上項目。項目摘要 由於不完整輸入、數據抽取錯誤、異質數據格式等眾多原因,數據缺失的情況非常普遍,嚴重影響各種套用的可靠性。缺失數據填補作為數據質量管理的基礎問題之一,引起學術界和工業界廣泛關注。現有的數據填補方法受數據稀疏...
《具有缺失數據的不同模型的變數選擇及其套用》是依託雲南大學,由陳黎擔任負責人的國家自然科學基金資助青年科學基金項目。項目簡介 在統計分析中,數據缺失的現象是非常普遍的。變數選擇是統計數據分析必不可少的工具,對缺失數據和變數選擇的研究已有許多研究成果。對於缺失數據問題的變數選擇問題是新的統計挑戰問題。近...
《缺失數據下廣義線性模型的經驗似然方法》是依託陝西師範大學,由陳夏擔任項目負責人的數學天元基金項目。項目摘要 廣義線性模型是經常用來分析不同類型數據的工具。它在套用上,尤其是在生物、醫學和經濟、社會數據的統計分析上,有重要的意義。而缺失數據是套用中經常出現的問題。本項目致力於含有缺失數據的廣義線性模型...
《數據分析方法五種》是2011年10月17日格致出版社出版的圖書,作者是尤恩·蘇爾李。該書從基平設計的分析入手,介紹了分析複雜調查數據的傳統方法,闡述了如何處理社會科學研究中的缺失數據。同時對跨學科的社會網路分析法進行了說明,並詳細介紹了因子分析法。最後,從基於模型的角度,以舉例的形式詳細解釋了基於行動...
《不可忽略缺失數據的工具變數方法研究》是依託華東師範大學,由方方擔任項目負責人的青年科學基金項目。項目摘要 缺失數據的現象在抽樣調查、醫學研究、經濟金融等很多領域都普遍存在,因此在數據有缺失的情況下如何進行統計推斷一直都是統計學的重點研究方向。其中,在“不可忽略缺失數據”下的參數識別和估計是一個非常...
《含非正態及缺失數據的結構方程模型分析》是依託江蘇師範大學,由劉鵬飛擔任項目負責人的青年科學基金項目。項目摘要 結構方程模型是一類常見且重要的潛在變數模型。在以往的研究中,多數的統計方法都假定數據服從常態分配,但它們在處理非正態及缺失數據時會出現較大偏差。缺失數據以及包含偏斜數據、重尾數據和異構數據...
本項目的資助下,我們收集分析了大量公車、計程車和網約車的旅行時間數據。 首先,我們研究了不同交通狀態下的旅行時間變化規律,研究旅行時間偏峰和多峰分布的成因,建立了交通流時空分布特徵和旅行時間分布模型之間的關係。 其次,我們研究了交通流的波動特性,並揭示了交通數據壓縮、交通異常數據檢測、交通缺失數據...
《概化理論多側面設計缺失數據方差分量及其變異量估計》是依託華南師範大學,由黎光明擔任項目負責人的面上項目。項目摘要 概化理論廣泛套用於心理測評實踐中。方差分量估計是進行概化理論分析的關鍵。方差分量估計受限於抽樣,需要對其變異量進行探討。多數學者僅關注概化理論完備數據的方差分量及其變異量估計,卻對缺失...
本項目分別研究反映變數缺失或協變數缺失時降維方法與降維技術,在反映變數缺失時我們將首先發展融合-精練兩步方法找到中心降維子空間,發展機率質量函式加權imputation方法估計所獲得的中心降維子空間的基,並證明是根號n相合估計,將Zhu等(2009,Biometrika)中估計維數的方法推廣到缺失數據情形;我們還將發展反映變數缺失時...
《缺失數據下廣義線性模型的經驗似然和變數選擇問題》是依託陝西師範大學,由陳夏擔任項目負責人的青年科學基金項目。項目摘要 廣義線性模型是經常用來分析不同類型數據的工具。它在套用上,尤其是在生.物、醫學和經濟、社會數據的統計分析上,有重要的意義。而數據的缺失是套用中經常出現的問題。本項目致力於缺失數據下...
特別是在我國現實經濟的運行中,由於某種特殊的需要和費經濟因素的干預,數據失真、扭曲和缺失等數據缺陷形成了經濟定量分析和經濟理論研究的“數據瓶頸”,尤其是市場微觀層面的數據不齊備,信息要素的市場作用發揮得不完善、流通不暢,以至能拿到什麼品質的數據,才能做出什麼檔次的研究成果。而由此造成的誤差明顯大於檢驗...
《缺失數據下基於經驗似然的穩健推斷函式》是依託吉林大學,由劉天慶擔任項目負責人的青年科學基金項目。項目摘要 秩回歸是一種高效且穩健的非參數方法。但在實際套用中,數據缺失的情況經常發生,甚至是不可避免的。這給實際工作者使用秩回歸方法造成了很大的困難。據我們所知,在回響變數或部分協變數數據缺失的情況下...
數據清洗(Data cleaning)– 對數據進行重新審查和校驗的過程,目的在於刪除重複信息、糾正存在的錯誤,並提供數據一致性。數據清洗從名字上也看的出就是把“髒”的“洗掉”,指發現並糾正數據檔案中可識別的錯誤的最後一道程式,包括檢查數據一致性,處理無效值和缺失值等。因為數據倉庫中的數據是面向某一主題的數據...
《缺失數據下加速失效時間模型的經驗似然推斷》是依託長春工業大學,由袁曉惠擔任項目負責人的數學天元基金項目。項目摘要 在生存分析中,加速失效時間模型已經得到了廣泛套用。但在實際套用中,數據缺失的情況經常發生,甚至是不可避免的。這給實際工作者使用加速失效時間模型造成了很大的困難。本項目打算在部分協變數隨機...
《數據挖掘方法在水文缺失數據插補中的套用》是2012年科學技術文獻出版社出版的圖書,圖書作者是韓雅鳴。內容簡介 缺失值是現實生活中普遍存在的現象,其出現的原因可能是客觀方面的,也可能是人為主觀方面的。缺失值的存在不僅對生產、管理過程產生一定的影響,同時也使得一些記錄性數據在做後期分析時遇到困難。因此,...
《基於周期信息的時間序列缺失值填補方法研究》是依託中山大學,由張晉昕擔任項目負責人的面上項目。中文摘要 由於各種原因,醫學實踐中的時間序列常出現缺失值。本研究針對時間序列中出現的缺失值(連續型、完全隨機型)問題,探討填補缺失數據的方法。填補流程中充分納入頻域信息和時域信息(填補工作的空間:時域→頻域→...
《生物醫學數據統計分析的方法、理論與套用》是依託中國科學院數學與系統科學研究院,由王啟華擔任項目負責人的重點項目。項目摘要 本項目研究生物醫學數據包含高維或超高維數據、函式型數據、縱向數據、缺失數據及隨機刪失數據統計分析的方法、理論與套用,開展統計學與生物醫學交叉研究。具體地,我們探討生物醫學一些重要...
《缺失數據下的廣義線性模型》是2013年武漢大學出版社出版的圖書,作者是肖枝洪、程新躍。摘要 本書分為七章,主要內容包括:準備工作、不完全信息和隨機截尾的廣義線性模型、不完全信息隨機截尾廣義線性模型的極大似然估計的相合性與漸近正態性等。目錄 前言 第1章準備工作 1.1大數定律和中心極限定理 1.2重對數律...