分層廣義線性模型

分層廣義線性模型

分層廣義線性模型(hierarchical generalized linear models (HGLM))可視為廣義線性模型的推廣。在廣義線性模型中,誤差分量是統計獨立的,然而這一假設並非總是成立的。即在有些情況下,誤差項之間有函式關係。分層廣義線性模型允許有不同的誤差分量,誤差分量可以統計相關的,並不必要滿足常態分配。當有不同的聚類存在時,同一聚類中的觀測值是相關的,並且是正相關的。在這種情況下,廣義線性模型是不適用的,忽略這些關聯會引起造成一些問題。

基本介紹

  • 中文名:分層廣義線性模型
  • 外文名:Hierarchical generalized linear model
  • 實質:分層廣義線性模型
  • 特點廣義線性模型
概論,模型,可識別性,不同分布函式和連結函式的模型,擬合,套用,工程,商業,

概論

模型

在分層模型中,觀測值可進行聚類,並且觀測值的分布不僅由所有聚類的共同結構決定,也由聚類的具體結構決定。於是,模型要引入隨機效應分量,並且不同的聚類有不同的隨機效應分量。設
為回響變數,
為隨機效應,
為連結函式。在分層廣義線性模型中,需要假設
滿足:
線性預測器形式為:
其中,
的嚴格單調函式。在分層廣義線性模型中,固定效應為
,對所有觀測值都相同。隨機分量
是不可觀測的,不同聚類對應的隨機分量取值是隨機的。於是,同一聚類的觀測值對應的
的取值相同,不同聚類的觀測值對應的
的取值也不同。

可識別性

為了進行參數推斷,有必要保證滿足可識別性。在以上模型中,v是不可識別的,因為
其中
為常數。要使模型可識別,需要對參數另加約束。約束常加在隨機效應上,比如

不同分布函式和連結函式的模型

假設不同的分布函式
,採用不同的連結函式
和 '
,可以得到不同的模型。另外,廣義線性混合模型是分層廣義線性模型的一個特例。在分層廣義線性模型中, 隨機效應的分布函式
不必要滿足常態分配。如果
的分布為常態分配,
的連結函式為恆等函式,此時的分層廣義線性模型即為廣義線性混合模型。
的分布可取為共軛分布,此時分層廣義線性模型有一些特殊的性質,並且易於計算和理解。比如,如果
的分布為平均值一定的泊松分布
的分布為伽瑪分布,並取標準對數連線函式,則此時分層廣義線性模型為泊松共軛分層廣義線性模型。如果
的分布為平均值一定的二項分布
的分布為共軛貝塔分布,採用標準羅吉特連線函式,則此時分層廣義線性模型為貝塔共軛模型。另外,廣義線性混合模型其實就是正態共軛分層廣義線性模型。
常見的模型總結如下:
Commonly used models
模型名字y的分布y 和 u的連線函式u的分布u 和 v 的連線函式
正態共軛
二項共軛
羅吉特
羅吉特
泊松共軛
伽瑪共軛
逆伽瑪分布
二項GLMM
羅吉特
泊松 GLMM
伽瑪 GLMM

擬合

分層廣義線性模型適用條件是觀測值可歸為不同的聚類。估計函式有兩類:固定效應估計函式和隨機效應估計函式,分別相應於
中的參數。有多種方法進行分層廣義線性模型中的參數估計。如果只對固定效應估計函式感興趣,可以採用總體平均模型。如果要推斷個體,就需要估計隨機效應。擬合分層廣義線性模型有多種技術。

套用

分層廣義線性模型在實際生活中有諸多套用。

工程

這一模型可用於分析半導體製造中相互關聯的過程形成的負載的層級過程。工程師可以套用此模型發現和分析重要的次過程,同時評估這些次過程對最終性能的影響。

商業

市場問題也可以用分層廣義線性模型來分析。研究者套用此模型研究了一國範圍內的消費者,以解決國際市場研究中的嵌套數據結構問題。

相關詞條

熱門詞條

聯絡我們