熵的概念是由資訊理論的創始人申農(Shannon)提出的,在統計學中用它作為隨機事件不確定程度的一種度量,描述給定長度為n的隨機變數序列的熵隨n的增長情況。
基本介紹
- 中文名:熵率
- 外文名:Entropy rate
- 所屬學科:數學
- 研究對象:隨機變數序列
- 意義:對隨機事件不確定程度的一種度量
基本介紹,定義,舉例說明,重要定理,定理1,定理2,定理3,定理4,
基本介紹
定義
當如下極限存在時,隨機過程 的熵率定義為
舉例說明
下面考慮幾個簡單的隨機過程例子及其相應的熵率。
1.打字機。假定一台打字機可輸出m個等可能的字母。由此打字機可產生長度為n的個序列,並且都等可能出現。因此, ,熵率為 比特/字元。隨機過程的熵率43符。
2.i.i.d. 隨機變數序列 。此時,有
這正是我們所期望的每字元的熵率。
3.獨立但非同分布的隨機變數序列。在此情形下,有
但 不全相等。我們可以選擇 的一個分布序列,使 的極限不存在。例如取二值隨機分布序列,其中 不是常數,而為i的函式。通過細心選取 匕糾可使得式 的極限不存在。例如,對 取
此時,該序列的情況是,滿足 的隨機變數序列(可以任意長)之後,緊接著是更長以指數變化的序列滿足 。所以, 的累積平均值將在0與1之間振盪,從而不存在極限。因此,該過程的無定義。
我們也可以定義熵率的一個相關的量(如果下列極限存在):
和這兩個量反映了熵率概念的兩個不同方面。第一個量指的是n個隨機變數的每字元熵,而第二個量指在已知前面n-1隨機變數的情況下最後一個隨機變數的條件熵。
重要定理
定理1
對於平穩隨機過程,式和式中的極限均存在且相等:
=
我們先來證明存在。
定理2
對於平穩隨機過程,隨n遞減且存在極限。
證明:
其中的不等式由條件作用使熵減小這個性質得到,而等式由該過程的平穩性得到。由於是非負且遞減的數列,故其極限存在。
接下來使用數學分析中的一個如下簡單結論。
定理3
均值:若,且,則。
證明:(非正式思路)由於序列中的大部分項最終趨於a,那么,是的前n項的平均,也將最終趨於a。正式證明閱參考資料。
定理1的證明 由鏈式法則
也就是說,熵率為條件熵的時間平均。然而,我們已經知道條件熵趨於極限H',因此,由定理3可知,條件熵的累積平均存在極限,且此極限就是其通項的極限H'。於是,由定理2,
研究隨機過程熵率的重要意義體現在平穩遍歷過程的AEP。
對任何平穩過程,熵率均有恰當的定義。而對於馬爾可夫鏈,計算熵率尤為容易。
馬爾可夫鏈對於平穩的馬爾可夫鏈,熵率為
==其中的條件熵可根據給出的平穩分布計算得到。注意到,平穩分布為下列方程組的解:
其中為任意值。
定理4
設為平穩馬爾可夫鏈,其平穩分布為,轉移矩陣為P。則熵率為
證明:。