條件隨機場(conditional random field,簡稱 CRF),是一種鑑別式機率模型,是隨機場的一種,常用於標註或分析序列資料,如自然語言文字或是生物序列。
基本介紹
- 中文名:條件隨機域
- 外文名:conditional random field
- 簡稱: CRF
- 性質:一種鑑別式機率模型
簡介,隨機場,馬爾可夫網路,隱馬爾可夫模型,
簡介
如同馬爾可夫隨機場,條件隨機場為無向性之圖模型,圖中的頂點代表隨機變數,頂點間的連線代表隨機變數間的相依關係,在條件隨機場當中,隨機變數 Y 的分布為條件機率,給定的觀察值則為隨機變數 X。原則上,條件隨機場的圖模型布局是可以任意給定的,一般常用的布局是鏈結式的架構,鏈結式架構不論在訓練(training)、推論(inference)、或是解碼(decoding)上,都存在有效率的算法可供演算。
條件隨機場跟隱藏式馬可夫模型常被一起提及,條件隨機場對於輸入和輸出的機率分布,沒有如隱藏式馬可夫模型那般強烈的假設存在。
隨機場
隨機場(Random field)定義如下:
馬爾可夫網路
馬爾可夫網路類似貝葉斯網路用於表示依賴關係。但是,一方面它可以表示貝葉斯網路無法表示的一些依賴關係,如循環依賴;另一方面,它不能表示貝葉斯網路能夠表示的某些關係,如推導關係。馬爾可夫網路的原型是易辛模型,最初是用來說明該模型的基本假設。
一個馬爾可夫網路的重要變體是條件隨機場,每個隨機變數可以條件依賴於一組全局的觀察。這個模型中,每個函式是從指派值到團k和從觀察到非負實數的映射。這樣的馬爾可夫網路更適於不對觀察建立分布模型的區分性模型,不是生成性模型。
隱馬爾可夫模型
隱馬爾可夫模型(Hidden Markov Model,HMM)是統計模型,它用來描述一個含有隱含未知參數的馬爾可夫過程。其難點是從可觀察的參數中確定該過程的隱含參數。然後利用這些參數來作進一步的分析,例如模式識別。
在正常的馬爾可夫模型中,狀態對於觀察者來說是直接可見的。這樣狀態的轉換機率便是全部的參數。而在隱馬爾可夫模型中,狀態並不是直接可見的,但受狀態影響的某些變數則是可見的。每一個狀態在可能輸出的符號上都有一機率分布。因此輸出符號的序列能夠透露出狀態序列的一些信息。