德國坦克問題

在統計學理論的估計中,用不放回抽樣來估計離散型均勻分布最大值問題中著名的德國坦克問題(英語:German tank problem),它因在第二次世界大戰中用於估計德國坦克數量而得名。

基本介紹

  • 中文名:德國坦克問題
  • 外文名:German tank problem
簡介,歷史上的問題,具體數據,類似分析,參見,其他對估計的討論,

簡介

在統計學理論的估計中,用不放回抽樣來估計離散型均勻分布最大值問題中著名的德國坦克問題(英語:German tank problem),它因在第二次世界大戰中用於估計德國坦克數量而得名。
這些分析說明了頻率推斷和貝葉斯推斷之間的不同。
基於“單個”樣本估計的樣本總數各有不同,而在“多個”樣本的基礎上估計則是現實生活中一個很有意義的估計問題,它的答案很簡單,但並不那么明顯。

歷史上的問題

在戰爭的過程中,西方盟國一直在努力確定德國的生產速度,並以兩種主要方式得到這個數據:常規情報收集和統計估計。大部分情況下,統計估計的可信度很大程度上決定於常規情報收集。而有時常規情報收集會和統計估計一起結合使用,如在D日前夕估計豹式坦克的生產速度。
盟軍指揮機構已經注意到了出現在義大利的五號坦克(豹式坦克),速度快,裝備有75 mm/L70長管戰車炮,是很不尋常的重型坦克,但在法國北部編號就很小,就和虎I坦克在突尼西亞那樣。由於謝爾曼坦克在對陣三號坦克四號坦克時表現良好,美國陸軍對它非常自信,以至於迫不及待地希望與他們相遇。就在D日的不久前,有訊息稱德國手中有大量的五號坦克。
為了確定這種說法的真實性,盟軍要嘗試估計正在生產坦克的數量。為此,他們要使用被繳獲或被摧毀的坦克的序列號。他們主要使用變速箱的號碼,因為其為兩個完整的序列。底盤和發動機號碼也有使用,但它們的編號規則比較複雜。各種其他的零件用來對分析結果進行交叉檢查。對輪胎也做了類似的分析,其上觀察到了順序編號(即1、2、3、……、N)。
對坦克車輪的分析產生了對使用中的車輪模具數量的估計。在與英國車輪製造商討論過後,他們估計了這么多的模具可以生產多少車輪,進而是每個月可生產的坦克數量。對兩輛坦克(每輛32個車輪,總計64個車輪)車輪的分析的結果是1944年2月的生產數量估計在270左右,大大超出此前預期。
德國戰後公布的記錄顯示,1944年2月一個月的生產量是276輛。統計方法結果的精確度是常規情報收集方法所遠遠不能達到的,而“德國坦克問題”這個詞也成為了這種統計分析問題的標誌。
估計產量並不是這種序列號分析的唯一套用。它也用於探查更多德國生產的信息,包括工廠數目、工廠的相對重要性、供應鏈長度(基於生產和使用之間的滯後程度)、生產工藝的改變、及對諸如橡膠等資源的使用。

具體數據

根據常規盟軍情報的估計,德國在1940年6月和1942年9月之間,每月大約能生產1,400輛坦克。將繳獲坦克的序列號代入下文的公式,可計算出每月246輛。戰後,從阿爾伯特·斯佩爾所管轄的部門繳獲的德國生產記錄顯示,實際數目是245輛。
某些特定月份的估計如下:
月份
統計估計
情報估計
德國記錄
1940年6月
169
1,000
122
1941年6月
244
1,550
271
1942年8月
327
1,550
342

類似分析

在二戰期間,類似的序列號分析也在其他軍事裝備上套用過,其中最成功的屬V-2火箭
二戰期間,德國情報部門分析了蘇聯軍事裝備工廠,韓戰期間蘇聯裝備工廠也被分析過。蘇聯在二戰期間也估計過德國坦克的生產數。
20世紀80年代,一些美國人被獲準進入以色列的梅卡瓦坦克的生產線。生產編號是分類過的,但水箱上有序列號,可以用來估計生產量。
該公式在非軍事中也有使用,如估計Commodore 64計算機的總數,其結果(1.25億)與官方數字相當匹配。

參見

  • 標記重捕法,另一種估計樣本總數的方法
  • 最大間距估計,對“假設均勻分布”直覺的推廣
  • 哥白尼原則,類似的預測,基於單個樣本(目前的年齡)計算預期壽命。
  • 一個套用:末日論,估計人類的預期生存時間

其他對估計的討論

相關詞條

熱門詞條

聯絡我們