在文本圖像壓縮中,當標記被抽取以後,它們要和已經在圖像庫中的符號進行匹配,但是庫中符號數量較多,為了加快匹配速度,必須降低執行的匹配數量。庫模板篩法是一種基於特徵的模板匹配方法,其中特徵不是標記的高度和寬度,而是標記的周長和面積,因為這兩個特徵抵禦數位化過程中引入的噪聲。
基本介紹
- 中文名:庫模板篩法
- 外文名:Library template sieving
- 學科:計算機科學
- 定義:一種基於特徵的模板匹配方法
- 特徵:標記的周長和面積
- 作用:加快匹配速度
定義,模板匹配,標記,文本圖像,
定義
庫模板篩法是一種模板匹配方法,主要基於標記的特徵,與輸入標記明顯不同的符號不必匹配,例如在寬度和長度上明顯不同的模板必定是不相似的。庫模板篩法主要基於面積和周長,當抽取標記後很容易得到這些數據,然而在實踐的操作中並沒有看起來容易,一方面因為它們和標記的寬度和高度有關;另一方面因為它們對噪聲和數位化過程的參數特別敏感。其他看上去更確定的特徵是垂直和水平的白行程數。庫模板篩法的一個更好基礎應該是比較兩個標記中黑像素團的分布。通過將像素根據其質心註冊,然後將其劃分為圍繞質心的4象限來實現。對於每個象限,計算其質心:對4個局部質心,分別計算其在兩個標記中位置的距離,最後將4個距離平均。這一過程可能不斷地重複,以確定一個基於原始質心的0級上距離(改質心距離為0,因為使用的是質心註冊)、一個如上所述的1級上的距離,以及更高級上的距離。測試表明,優良的篩選結果往往是在1級距離上獲得的,更複雜的處理並無必要。
模板匹配
文本圖像壓縮中需要創建在圖像中出現的形狀庫。這些形狀通常和字元有關,在圖像中出現的形狀就會被指向圖形庫的指針替換。一般來說,雖然存在許多變體,但處理步驟包括如下:
- 找出、分離並且抽取所有的標記,即圖像中聚集在一起出現的黑色像素。
- 建立一個包含圖像中發現所有標記的庫
- 通過識別圖像中的符號找到庫中與之最接近的標記實現,並度量一個標記和下一個標記的偏移值。
- 壓縮符號順序和偏移並存儲入庫。由於這一步驟中所存儲的信息可以產生稱為重構文本的原始圖像的近似,所以為了重構圖像無損,需要包括下面處理步驟:存儲足夠的信息以完成從重構文本中恢復原始圖像。
當標記被抽取出來以後,需要將其與已經在庫中的標記匹配,所有匹配庫成員的標記都會被保存在一個集合中。如果當前標記與庫中現有的一個標記足夠匹配的話,則將其添加到與改符號相應的匹配標記集中,儘管將一個標記與每一個庫中模板進行匹配查找出與其最接近模板的可靠,但在一個模板被發現於一個特定的相似閾值之內時即立即終止運算會更有效。如果沒有發現足夠近似的匹配點,則將新標記添加到庫中。模板匹配對成功識別標記至關重要,匹配過程一般通過檢查誤差圖來實現,誤差圖通過將新符號和庫成員逐比特進行異或得到。在計算誤差圖之前,匹配的雙方必須要正確註冊。新符號添加在庫中每個符號之前,為此需要在庫中設定一個固定的參考點。
標記
標記(signature)是邊界的一維表達,可以用多種方法來產生。其基本思想是將原始的二維邊界用元函式來表示,以降低表達難度。最簡單的方法就是把從重心到邊界的距離作為角度的函式來標記。
標記與鏈碼同樣不受邊界平移的影響,但是當邊界旋轉或者發生尺度變換時,標記格會發生改變。對於旋轉問題,可以採用類似於鏈碼的旋轉歸一化方法進行解決。更常用的方法是通過固定標記的起始點來歸一化。例如,可以選擇離重心最遠的邊界點作為起始點,或者選擇主軸上的某一點。雖然後者的計算量比較大,但是它比前者更加可靠,因為它用到了所有的邊界點來參與計算。而對尺度變化則可以通過幅度的歸一化來處理。
文本圖像
概述
文本圖像(textual image 或 text image)是一種特殊類型的黑白二值圖像,它的主要特點是其內容一般由文字部分組成。從數據壓縮的角度來看,文本圖像存在點陣圖和符號兩個層次的冗餘,後者是由圖像中重複的符號引起的。針對文本圖像的壓縮標準和算法主要G3,G4JBIG和JBIG2等,其中 G3,G4和 JBIG 都是基於點陣圖層次的壓縮方法,而JBIG2是基於點陣圖和符號層次冗餘的兩層壓縮方法。另外,基於混合光柵內容( mixed raster content,MRC) 的DjVu 主要用於複合文檔的壓縮,它通過一個黑白二值掩碼(mask)將圖像分成前景和背景,然後對不同的部分再採用適合的算法分別進行壓縮,其中對於掩碼的壓縮採用的是JB2算法。JB2 是 JBIG2 的一種變體,它和 JBIG2 的基本思想和實現方法都是類似的。JBIG2是最先進的文本圖像壓縮算法,如上所述它實現了一個兩層壓縮結構:首先根據“字典”的思想,採用模式匹配策略將不同的符號存儲到一個模式字典中,這樣圖像中相同的符號就可以用字典中的匹配符號及其索引進行替代;然後對於得到的字典、索引以及符號的位置信息再採用基於信息熵的算術編碼進行壓縮。 模式匹配的過程中,所謂“相同”的符號是指其相對於人的視覺是相同的,而在點陣圖層次往往不完全相同。如何將視覺上相同的符號歸為一類是模式匹配算法面臨的一個很大挑戰。這是因為,由於掃描過程中的抖動、噪音 等原因,有些視覺上相同的符號在點陣圖層次可能有比較大的差異,而某些外形接近的不同符號在點陣圖層次的差異可能是比較小的。和英文文本圖像相比,中文文本圖像中的字元集規模更大,很多漢字結構比較複雜,且形近字非常多。中文文本圖像的這些特點增加了對符號進行模式匹配的難度。
JBIG2 是由 ITU和ISO組成的二值圖像聯合專家組(joint bi-level image expert group,JBIG)提出的一個壓縮標準。JBIG2 的一個重要特點是:只規定了解碼的標準和流程,而並沒有定義一個明確的編碼器。JBIG2 將編碼程式開放,是為了鼓勵研究者們針對不同特點的文本圖像開發更加高效的編碼算法。
JBIG2 的主要技術最早由美國貝爾實驗室的Howard 等開發,主要包括 “模式匹配與替換 ”(pattern matching and substitution,PM&S) 和“軟模式匹配”(soft pattern matching,SPM)技術。這些技術後來被ISO 採納成為了 JBIG2 標準的一部分。美國加州大學聖地亞哥分校的 Ye 等對JBIG2 進行了系統的研究 ,主要從符號字典設計 、模式匹配速度和有損壓縮的重構圖像質量控制等方面提出了很多先進的算法。對於有損壓縮系統,Ye 等針對英文字元的特點提取了符號的尺寸、象限矩心距離(quadrant centroid distance,QCD)以及拓撲結構作為特徵,並利用這些特徵來減少有損壓縮中的替換誤差。由於 Ye 等在 JBIG2 方面所做出的出色工作,其研究成果通過加州大學聖地亞哥分校的技術轉移部門轉讓給了Apago 公司並套用到其商業化的產品中,成功實現了技術成果的轉化。
意義
對於一些非常重要的正式檔案,它的主要存儲方式為文本圖像。與文本檔案相比較,圖像檔案能夠對場景更加直觀、真實的進行表述,對其不易進行篡改或者偽造。比如一些更能體現其真實性和有效性的圖像檔案,如包含手寫簽名、銀行票據的圖像檔案。當今社會,不管是在商業經濟方面還是政府部門等領域,對於很多重要的信息都是以電子圖片的方式進行交流的。然而,不管是什麼事物,它都具有兩面性,在圖像檔案的管理方面,有著不容忽視的劣勢。如果用圖像的形式存儲文字信息,信息量將變得很大,所需的存儲空間也比電子文本檔案大,不利於文字信息的快速識別。隨著計算機技術的進步,這些不足將會逐漸被克服。
- 文本圖像檢索的實際套用涉及面廣,可以運用到辦公的檔案管理、日常生活的檔案查詢、國企銀行單位票據檔案查詢和檢索等多個方面。
- 文本圖像檔案的高效、智慧型分類。在工作中,為了提高管理效率、使得信息的查詢更加方便,就需要對大量的文本圖像信息做一定的整理和分類。比如公司契約檔案,它是依據公司標誌信息的不同,利用文本圖像檢索技術將大量的錯綜複雜的圖像檔案進行分類和歸檔,高效智慧型的完成圖像檔案的管理,提高了業務辦公的智慧型性和效率。
- 文本圖像自動查詢。雖然已經有 PDF、WORD 等電子文檔查詢的套用軟體,但是用於檢索文本圖像內容的套用軟體很罕見。日常生活中對文本圖像檔案檢索的需求卻在增加。如果對大量文本圖像進行管理,不僅需要大量的人力、物力,而且工作量也非常大。尤其是需要查找圖片檔案中的關鍵字等特定信息,就要人工進行查看每張圖的內容,並且還要相當仔細,導致工作量的增加,效率也不高,不但成本耗費大,也不能滿足當前實際套用的需求。本文所研究的文本圖像自動檢索技術實現文本圖像檔案的快速查詢和智慧型管理,能夠幫助檔案管理
- 人員快速、高效地處理圖像文本檔案,具有較大的實際套用意義。
- 智慧財產權保護。隨著 IP 時代的到來,人們對智慧財產權也越來越重視,並頒布了相關法律對其進行保護。為了有效地管理和搜尋查詢只是產權檔案,可以使用文本圖像檢索技術。圖像檔案保證了產權檔案的不易篡改,自動檢索技術提供了關鍵信息的快捷查詢。隨著文本圖像檔案量的急劇增加,文本圖像的檢索技術的作用體現得越來越明顯。
- 契約管理。在當今法制社會中,具有法律效力的契約檔案是經濟市場中不可或缺的檔案。契約檔案的關鍵信息之一是個人簽章或者手寫簽名。在契約檔案圖像的管理中,管理檔案的員工不需要埋頭在紙質文檔中尋找領導需要的契約檔案,只需敲敲手指就能在計算機上查找出來。手寫字型的自動檢索技術套用到契約圖像檔案中個人簽名內容的識別,將大大提高對契約管理的效率。
- 其它用途。文本圖像檢索技術同樣可以套用到軍事中,對危險病毒檔案自動監控和攔截以及對遠方地理信息的描述等等。