自然語言文本可恢復水印研究

《自然語言文本可恢復水印研究》是依託湖南大學,由劉玉玲擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:自然語言文本可恢復水印研究
  • 項目類別:青年科學基金項目
  • 項目負責人:劉玉玲
  • 依託單位:湖南大學
中文摘要,結題摘要,

中文摘要

文本是普遍使用的一種信息存儲與傳輸媒體,利用數字水印技術保護文本著作權以及對文本內容進行認證等具有重要意義。早期基於格式的文本數字水印技術不能抵禦重新排版和光學字元識別攻擊,實用價值不強。基於內容的自然語言文本水印技術代表了文本水印技術的發展趨勢,但載入信息後的文本容易導致內容失真,使得它在政府公文、法律條文和文學作品等領域內難以套用。本項目首先對現有自然語言文本水印方法引起的文本失真情況進行評測,然後重點圍繞自然語言文本可恢復水印的相關理論、方法與關鍵技術開展研究。主要研究內容包括:自然語言文本水印的失真評測方法研究、大容量自然語言文本水印方法研究、自然語言文本壓縮方法研究、自然語言文本的可逆變換研究等。通過本課題的研究,將在理論上為自然語言文本可恢復水印領域的研究提供新原理與新方法,在套用上為文本著作權保護、文本認證等提供技術保障。

結題摘要

信息技術的快速發展,各種類型的多媒體數據以數位化的形式在網路上發表和傳播。然而由於網路的不安全性,數位化的多媒體數據很容易受到非法複製、拷貝和篡改。因此,必須對這些多媒體數據進行保護和內容認證。本項目針對早期基於格式的文本數字水印技術不能抵禦重新排版和光學字元識別攻擊、基於內容的自然語言文本水印技術載入信息後容易導致內容失真等問題進行了研究。在自然語言文本水印新方法研究方面,提出了多種基於同義詞詞林、詞性頻率、詞語信息熵、句子多特徵融合、依存句法以及雲模型等的中文文本零水印方法,可以有效地避免內容失真,同時又能達到對自然語言文本進行內容認證的目的;在可逆變換方面,提出了六種可恢復水印方法;在文本壓縮編碼方面,提出了基於塊編碼、Huffman 編碼、矩陣編碼和詞間依存關係的自然語言文本壓縮方法;在水印評測方面,提出了兩種預測方法。為自然語言文本可恢復水印的後續研究提供了良好的基礎。
check!

熱門詞條

聯絡我們