基本介紹
- 中文名:伯克松悖論
- 外文名:Berkson's paradox
- 別名:伯克森悖論
- 所屬學科:醫學統計
內容簡介,分析,
內容簡介
伯克森悖論是美國醫生和統計學家約瑟夫·伯克森在 1946 年提出的一個問題。他研究了一個醫院中患有糖尿病的病人和患有膽囊炎的病人,結果發現患有糖尿病的人群中,同時患膽囊炎人數較少;而沒有糖尿病的人群中,患膽囊炎的人數比例較高。這似乎說明患有糖尿病可以保護病人不受到膽囊炎的折磨,但是從醫學上講無法證明糖尿病能對膽囊炎起到任何保護作用。他將這個研究寫成了論文《用四格表分析醫院數據的局限性》,並發表在雜誌《生物學公報》上,這個問題就稱為伯克森悖論。
伯克森悖論產生的最主要原因是:文章中統計的患者都是醫院的病人,從而忽略了那些沒有住院的人。
分析
為了簡化起見,我們假設這個醫院只治療兩種疾病:糖尿病和膽囊炎。然後畫一個平面直角坐標系:橫坐標表示他患有糖尿病的嚴重程度,縱軸表示患有膽囊炎的嚴重程度,再把每一個人按照兩種疾病的輕重畫在坐標系中。
如果我們對全體人群進行統計,就會發現糖尿病和膽囊炎並沒有相關性。但是如果只對醫院中的患者進行統計,就會出問題。如果病人的糖尿病或者膽囊炎問題比較輕,病人就不需要住院,所以也不會被統計到。來到醫院的病人要么是糖尿病,要么是膽囊炎,要么二者兼有。所以,我們需要把圖像左下方的點都去掉,他們不在我們統計的範圍內,我們只會統計到這條線右上方的點。這回糖尿病和膽囊炎就表現出負相關了。不患有糖尿病的人,更有可能患有膽囊炎,而患有糖尿病的人,膽囊炎的比例就會下降了。
可見伯克森悖論是一種統計偏差,因為我們忽略了身體健康而沒有入院的人,只在醫院的病人中進行統計,這些病人一定患有這樣或者那樣的疾病。所以,如果患者沒有糖尿病,那么就一定患有其他疾病,比如膽囊炎,這就形成了糖尿病與膽囊炎負相關的假象。