馬爾科夫隨機場
(Markov Random Field)
什麼是隨機過程
在當代科學與社會的廣闊天地里,人們都可以看到一種叫作隨機過程的數學模型:從銀河亮度的起伏到星系空間的物質分布、從分子的布朗運動到原子的蛻變過程,從化學反應動力學到電話通訊理論、從謠言的傳播到傳染病的流行、從市場預測到密碼破譯,隨機過程理論及其套用幾乎無所不在。人類歷史上第一個從理論上提出並加以研究的過程模型是馬爾科夫鏈,它是馬爾科夫對機率論乃至人類思想發展作出的又一偉大貢獻。
出於擴大極限定理套用範圍的目的,馬爾科夫在本世紀初開始考慮相依隨機變數序列的規律,並從中選出了最重要的一類加以研究。1906年他在《大數定律關於相依變數的擴展》一文中,第一次提到這種如同鎖鏈般環環相扣的隨機變數序列,其中某個變數各以多大的機率取什麼值,完全由它前面的一個變數來決定,而與它更前面的那些變數無關。這就是被後人稱作馬爾科夫鏈的著名機率模型。也是在這篇論文裡,馬爾科夫建立了這種鏈的大數定律。
什麼是馬爾科夫隨機過程和馬爾科夫鏈
用一個通俗的比喻來形容,一隻被切除了大腦的白鼠在若干個洞穴間的躥動就構成一個馬爾科夫鏈。因為這隻白鼠已沒有了記憶,瞬間而生的念頭決定了它從一個洞穴躥到另一個洞穴;當其所在位置確定時,它下一步躥往何處與它以往經過的路徑無關。這一模型的哲學意義是十分明顯的,用前蘇聯數學家辛欽(1894-1959〕的話來說,就是承認客觀世界中有這樣一種現象,其未來由現在決定的程度,使得我們關於過去的知識絲毫不影響這種決定性。這種在已知“現在”的條件下,“未來”與“過去”彼此獨立的特性就被稱為馬爾科夫性,具有這種性質的隨機過程就叫做馬爾科夫過程,其最原始的模型就是馬爾科夫鏈。
這即是對荷蘭數學家惠更斯(Ch. Huygens, 1629-1695)提出的無後效原理的機率推廣,也是對法國數學家拉普拉斯(P. S. Laplace, 1749-1827)機械決定論的否定。
這裡應該指出,儘管拉普拉斯對機率論的早期發展作出過重大貢獻,但是他的部分哲學觀點是不利於這門學科的深入發展的。十八世紀以來,隨著
牛頓力學的徹底勝利,一種機械唯物主義的決定論思潮開始在歐洲科學界蔓延,鼓吹最力者就是拉普拉斯。1759年他在巴黎高等師範學院發表了一篇題為《機率論的哲學探討》的演講,淋漓盡致地表達出了這種思想。他說:“假如有人知道了某一時刻支配自然的一切力,以及它的一切組成部分的相對位置,又假如他的智力充分發達,能把這一切數據加以充分的分析,把整個宇宙中從最巨大的天體到最微小的原子的一切運動完全包括在一個公式裡面,這樣對他就沒有什麼東西是不確定的了,未來也好,過去也好,他都能縱覽無遺。”1812年,
拉普拉斯又進一步提出“神聖計算者”的觀念,認為這個理想的數學家只須知道世界某一時刻的初始狀態,就可以從一個無所不包的微分方程中算出過去和未來的一切狀態。換句話說,他認為任意系統在 t > t0時的狀態 x可由其初始時刻 t0和初始狀態 x0唯一決定。這可真是筆判終身、細評流年,數學家可以擺個卦攤了。馬爾科夫的機率模型從根本上否定了系統中任一狀態 x與其初始狀態 x0之間的因果必然性,從而也否定了“神聖計算者”的神話。
還應該指出,馬爾科夫所建立的機率模型不但具有深刻的哲學意義,而且具有真實的物質背景,在他的工作之前或同時,一些馬爾科夫鏈或更複雜的隨機過程的例子已出現在某些人的研究中,只不過這些人沒有自覺地認識到這類模型的普遍意義或用精確的數學語言表述出來罷了。例如蘇格蘭植物學家布朗 ( R. Brown, 1773-1858) 於1827年發現的懸浮微粒的無規則運動、英格蘭遺傳學家
高爾頓(F.Galton, 1822-1911) 於1889年提出的家族遺傳規律、荷蘭物理學家埃倫費斯特 ( P. Ehrenfest, 1880-1933) 於1907年關於容器中分子擴散的實驗,以及傳染病感染的人數,謠言的傳播,原子核中自由電子的躍遷,人口增長的過程等等,都可用馬爾科夫鏈或過程來描述。也正是在統計物理、量子力學、遺傳學以及社會科學的若干新課題、新事實面前,決定論的方法顯得百孔千瘡、踵決肘見。
有趣的是,馬爾科夫本人沒有提到他的機率模型在物理世界的套用,但是他利用了語言文學方面的材料來說明鏈的性質。在《機率演算》第四版中,他統計了長詩《葉甫蓋尼·奧涅金》中元音字母和輔音字母交替變化的規律:這是長詩開頭的兩句,意為:“我不想取悅驕狂的人生,只希望博得朋友的欣賞。”詩人那火一般的詩篇在數學家那裡變成了一條冷冰凍的鎖鏈:在這條鎖鏈上只有兩種鏈環,C代表輔音、 代表元音(為了使問題簡化起見,不仿把兩個無音字母算作輔音)。馬爾科夫分別統計了在C後面出現C和 的機率p和1-p,以及在 後出現C和 的機率q和1-q,把結果與按照俄語拼音規則計算出的結果進行比較,證實了語言文字中隨機的(從機率的意義上講)字母序列符合他所建立的機率模型。
完成了關於鏈的大數定律的證明之後,馬爾科夫又開始在一系列論文中研究鏈的中心極限定理。1907年他在《一種不平常的相依試驗》中證明了齊次馬爾科夫鏈的漸近正態性;1908年在《一個鏈中變數和的機率計算的極限定理推廣》中作了進一步的推廣;1910年他發表了重要的論文《成連鎖的試驗》,在其中證明了兩種情況的非齊次馬爾科夫鏈的中心極限定理。與此同時他在一些假定的前提下證明了模型的各態歷經性,成為在統計物理中具有重要作用的遍歷理論中第一個被嚴格證明的結果。遍歷理論亦稱ergodic理論, 是奧地利物理學家玻耳茲曼(L. Boltzmann, 1844-1906) 於1871年提出來的,其大意是:一個系統必將經過或已經經過其總能量與當時狀態相同的另外的任何狀態。
馬爾科夫鏈的引入,在物理、化學、天文、生物、經濟、軍事等科學領域都產生了連鎖性的反應,很快地湧現出一系列新的課題、新的理論和新的學科,並揭開了
機率論中一個重要分支--隨機過程理論蓬勃發展的序幕。
馬爾科夫隨機場的通俗解釋
馬爾可夫隨機場(Markov Random Field)包含兩層意思。
馬爾可夫性質:它指的是一個隨機變數序列按時間先後關係依次排開的時候,第N+1時刻的分布特性,與N時刻以前的隨機變數的取值無關。拿天氣來打個比方。如果我們假定天氣是馬爾可夫的,其意思就是我們假設今天的天氣僅僅與昨天的天氣存在機率上的關聯,而與前天及前天以前的天氣沒有關係。其它如傳染病和謠言的傳播規律,就是馬爾可夫的。
隨機場:當給每一個位置中按照某種分布隨機賦予相空間的一個值之後,其全體就叫做隨機場。我們不妨拿種地來打個比方。其中有兩個概念:位置(site),
相空間(phase space)。“位置”好比是一畝畝農田;“相空間”好比是種的各種莊稼。我們可以給不同的地種上不同的莊稼,這就好比給隨機場的每個“位置”,賦予相空間裡不同的值。所以,俗氣點說,隨機場就是在哪塊地里種什麼莊稼的事情。
馬爾可夫隨機場:拿種地打比方,如果任何一塊地里種的莊稼的種類僅僅與它鄰近的地里種的莊稼的種類有關,與其它地方的莊稼的種類無關,那么這些地里種的莊稼的集合,就是一個馬爾可夫隨機場。