捕獲再捕獲抽樣是用於生態學以及估計野生動物總體數量的一種抽樣方法。其基本方法是從總體中抽取一個樣本,做上記號以後放回總體,使之與原總體的單位均勻地混合,經過適當的時間,再從中抽取一個樣本。根據已做記號與未做記號的比率來推斷總體的數量。
基本介紹
- 中文名:捕獲再捕獲抽樣
- 外文名:capture-recapture sampling method
- 所屬學科:數學
- 所屬問題:統計學(抽樣方法)
基本介紹,相關知識,直接抽樣法,逆抽樣法,
基本介紹
捕獲-再捕獲這一類抽樣方法最初起源於對野生動物的調查,方法的步驟是:先抽取一定的樣本,把這些單元做上記號,然後放回總體,使其與原總體的單元進行混合;再抽取一個樣本,以觀察其中做記號單元所占的比例,對總體單元數進行估計。
捕獲再捕獲抽樣套用場合:總體單元數N是未知的,是需要估計的目標。如估計一個池塘中魚的數量,一個森林中鳥類的數量,民眾集會的參加人數等。
關於捕獲再捕獲抽樣有很多模型,下面討論其中的直接抽樣法與逆抽樣方法。
相關知識
捕獲-再捕獲(capture-recapture)技術是現在廣為套用的技術,這是一種跨越機率抽樣與非機率抽樣的抽樣技術,“跨越”一詞是說這種技術超出機率抽樣與非機率抽樣的理論而又兼具兩種抽樣技術的特點。一方面,機率抽樣一般基於有限總體規模,而且總體規模N已知,一旦總體的大小N本身無法知曉,諸如樣本容量、抽樣比之類的指標就無法得到,從而抽樣設計以及估計量的計算都將無法進行,而捕獲-再捕獲技術恰恰超越了這一點,“竟然”可以用來估計總體規模的大小。另一方面,在進行捕獲-再捕獲的抽樣設計過程中的許多步驟,比如兩次抽樣的容量大小以及估計總體大小的前提的假定,雖然都有研究人員的經驗判斷成分滲透在內,卻一般都能給出估計的誤差大小,這一點顯然超出了非機率抽樣的範疇。
捕獲-再捕獲技術的產生已有很長的一段時間,最初用於魚類和野生動物總量的估計,又推廣到流行病學問題的研究中,現今已經成為一種在很多領域都有廣泛套用的調查與分析手段。在生態學中,捕獲-再捕獲方法多被稱為彼得森方法或林肯方法,因為彼得森在1894年用做記號的魚做過一些相關的研究工作,但這個方法真正被用於大規模的漁業研究則是由達爾在1917年實施的。1930年,林肯又巧妙地把這個方法用於估計鴨子總體的大小並獲得了很大成功,隨後薩卡和戴明繼續將這種方法發揚光大,並在出生死亡率和估計現時人口總數等題目的研究上取得了引人注目的成就.薩卡和戴明的有關論文被公認為是將捕獲-再捕獲技術套用到人類健康領域的劃時代成果。現今,套用捕獲-再捕獲技術的場合幾乎無所不在,前提是只要能得到待研究總體的兩個小規模子總體的單元名單。
直接抽樣法
該方法首先從研究的數量N未知的總體中抽取一個隨機樣本,設樣本量為t,將這些樣本單元做上記號後放回總體,經過適當的時間以後,這些樣本就與原總體均勻地混合在一起,很顯然,這時做記號的數量占總體數量的比例為t/N=P,這裡t是已知的,N是未知的,而P是待估計的,這就需要通過第二次抽樣來估計,假設第二次抽樣的樣本量為n,而其中有記號的單元數為s,我們可以通過圖1表示這一關係。
P的估計量為 ,將這一估計量代人前面的公式,可以得到N的估計量為
顯然,n要足夠大,才能使得 ,而且這裡 並不是N的無偏估計量。 的數學期望為
但當第一次樣本量t和第二次樣本量n都足夠大時, 就會逐漸變小,因此通常 是略有高估的, 的方差估計為