核密度估計原理

核密度估計原理

核密度估計是在機率論中用來估計未知的密度函式,屬於非參數檢驗方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。

基本介紹

  • 中文名:核密度估計原理
  • 外文名:Parzen window
  • 提出者:Rosenblatt、Emanuel Parzen
  • 提出時間:1955.1962
  • 套用學科:數學
  • 適用領域範圍:機率論
簡介,基本原理,邊界問題,

簡介

假設我們有n個數X1-Xn,我們要計算某一個數X的機率密度有多大。核密度估計的方法是這樣的:
核密度估計原理
其中N(x,z)為常態分配機率密度函式,z為設定的參數。

基本原理

在我們對某一事物的機率分布的情況下。如果某一個數在觀察中出現了,我們可以認為這個數的機率密度比較大,和這個數比較近的數的機率密度也會比較大,而那些離這個數遠的數的機率密度會比較小。基於這種想法,針對觀察中的每一個數,我們都可以f(x-xi)去擬合我們想像中的那個遠小近大機率密度。當然其實也可以用其他對稱的函式。針對每一個觀察中出現的數擬合出多個機率密度分布函式之後,取平均。如果某些數是比較重要,某 些數反之,則可以取加權平均。

邊界問題

邊界問題。比如滿足[0,1]之間的均勻分布的數有1000w個,人工大致已經可以看出機率分布。但用核密度估計估計出來的結果會非常奇怪。[-1,0]和[1,2]之間的數的機率密度不會被估計為0。主要原因是因為有邊界的影響。

相關詞條

熱門詞條

聯絡我們