人口數據質量評價分析是用一定的理論、指標和方法,對不同來源的人口數據的質量進行審議和評定,以確定人口數據可使用程度的一種分析。人口數據質量評價的範圍是廣義人口數據,即不僅包括一般以絕對數形成出現的未經任何處理的人或事件的量(狹義人口數據),還包括由這些絕對數推導的人口學指標。衡量人口數據質量的標準通常有三種:(1)效度。即用來測度某一現象或觀念的標識是否確切地反映了研究對象的客觀現實。(2)信度。又稱可靠性。反映數據的穩定性,指在同樣條件下,重複測度某現象或觀念其結果的一致性。(3)準確度。指調查值與真實值之間的差距。
根據人口數據誤差的嚴重程度,可將人口數據的質量分為三個等級:(1)完全不能使用;(2)有不同程度缺陷,調整後才能使用;(3)基本準確,可直接使用。誤差的來源主要有:由調查統計方案設計不科學而引起的“結構性缺陷”;由收集數據的某一環節的工作疏忽和收集數據參與人員的客觀條件和工作態度引起的誤差。誤差的表現形式有由於部分調查統計的信息遺失或被重複而引起的總量誤差(Complete-ness errors),和由於調查統計對象的信息被歪曲而引起的內容誤差(Content errors)兩種,也稱為漏報和錯報。在研究誤差時要用到毛誤差(所有誤差的總和)和淨誤差(某些誤差相互抵消後的余差)的概念。誤差的性質不同,評價數據質量的方法不同。