里所碼

里所碼簡介

里所碼被廣泛的套用於各種商業用途，最顯著的是在CD、DVD和藍光光碟上的使用；在數據傳輸中，它也被用於DSL和WiMAX；廣播系統中DVB和ATSC也閃現著它的身影；在計算機科學裡，它是RAID 6標準的重要成員。里所碼是定長碼。這意味著一個固定長度輸入的數據將被處理成一個固定長度的輸出數據。在最常用的（255,223）里所碼中，223個裡德-所羅門輸入符號（每個符號有8個比特）被編碼成255個輸出符號。

大多數里所錯誤校正編碼流程是成體系的（Systematic code）。這意味著輸出的碼字中有一部分包含著輸入數據的原始形式。
符號大小為8位的里所碼迫使碼長（編碼長度）最長為255個符號。
標準的（255,223）里所碼可以在每個碼字中校正最多16個裡所符號的錯誤。由於每個符號事實上是8個比特，這意味著這個碼可以校正最多16個短爆發性錯誤。

里所碼如同卷積碼一樣，是一種透明碼。這代表如果信道符號在佇列的某些地方被反轉，解碼器一樣可以工作。解碼結果將是原始數據的補充。但是，里所碼在縮短後會失去透明性。在縮短了的碼中，“丟失”的比特需要被0或者1替代，這由數據是否需要補足而決定。（如果符號這時候反轉，替代的0需要變成1）。於是乎，需要在里所解碼前對數據進行強制性的偵測決定（“是”或者“補足”）。

里所碼定義

在里德-所羅門數據編碼背後的核心可以形象化的表示為多項式。這種碼依靠一個代數理論，這個代數理論說明任何k個唯一的確定點表示一個階數至少為k-1的多項式。傳送者表明一個在有限域中的k-1階的多項式，它表示k個數據點。這個多項式就根據它在各點的賦值被“編碼”，實際傳送的是這些值。在傳輸中，一些值會被破壞。所以，實際傳送的點不止k個。只要正確地接收了足量的數值，接收方就可以推算出原始多項式，進而譯出原始數據。同樣的，我們可以通過插值來修正曲線。RS碼可以將一組有錯誤序列的信息碼轉換到找回畫出原始曲線的多項式的係數。