核密度估計

核密度估計

核密度估計(kernel density estimation)是在機率論中用來估計未知的密度函式,屬於非參數檢驗方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。Ruppert和Cline基於數據集密度函式聚類算法提出修訂的核密度估計方法。

基本介紹

  • 中文名:核密度估計
  • 外文名:kernel density estimation
  • 提出者:Rosenblatt 、Emanuel Parzen
  • 別稱:Parzen窗
簡介,一些比較常用的核函式,

簡介

核密度估計在估計邊界區域的時候會出現邊界效應
在單變數核密度估計的基礎上,可以建立風險價值預測模型。通過對核密度估計變異係數的加權處理,可以建立不同的風險價值的預測模型。
由給定樣本點集合求解隨機變數的分布密度函式問題是機率統計學的基本問題之一。解決這一問題的方法包括參數估計和非參數估計。參數估計又可分為參數回歸分析和參數判別分析。在參數回歸分析中,人們假定數據分布符合某種特定的性態,如線性、可化線性或指數性態等,然後在目標函式族中尋找特定的解,即確定回歸模型中的未知參數。在參數判別分析中,人們需要假定作為判別依據的、隨機取值的數據樣本在各個可能的類別中都服從特定的分布。經驗和理論說明,參數模型的這種基本假定與實際的物理模型之間常常存在較大的差距,這些方法並非總能取得令人滿意的結果。由於上述缺陷,Rosenblatt和Parzen提出了非參數估計方法,即核密度估計方法。
由於核密度估計方法不利用有關數據分布的先驗知識,對數據分布不附加任何假定,是一種從數據樣本本身出發研究數據分布特徵的方法,因而,在統計學理論和套用領域均受到高度的重視。
圖1.圖1.

一些比較常用的核函式

均勻核函式 k(x)=1/2,-1≤x≤1 加入頻寬h後: kh(x)=1/(2h),-h≤x≤h
三角核函式 k(x)=1-|x|,-1≤x≤1 加入頻寬h後: kh(x)=(h-|x|)/h2,-h≤x≤h
伽馬核函式 kxi(x)=(xα-1e-xα/xi)/[(xi/α)α.Γ(α)]
高斯核函式K(x,xc)=exp[-||x-xc||2/(2*σ)2],其中xc為核函式中心,σ為函式的寬度參數。

相關詞條

熱門詞條

聯絡我們