《面向CELP語音壓縮域的通用隱寫分析方法研究》是依託武漢大學,由任延珍擔任項目負責人的聯合基金項目。
基本介紹
- 中文名:面向CELP語音壓縮域的通用隱寫分析方法研究
- 項目類別:聯合基金項目
- 項目負責人:任延珍
- 依託單位:武漢大學
項目摘要,結題摘要,
項目摘要
碼激勵線性預測(CELP)是目前套用最廣泛的語音編碼模型,其壓縮域隱寫算法已出現,隱藏容量大且隱蔽性好,給隱寫分析帶來新的挑戰。本課題研究CELP壓縮域通用隱寫分析方法。在特徵提取方面,針對固定碼本、基音周期和LPC係數嵌入域,提出基於固定碼本最優搜尋原則、基於基音周期多階相關性度量、以及基於距離的LPC碼本統計分布特性的隱寫分析特徵,提高特徵的通用性;在隱寫分析學習方法方面,針對失配問題所帶來的檢測率下降問題,提出基於樣本層和特徵表示層域自適應學習的隱寫分析方法,通過源域和目標域的映射和模型遷移,提升算法的檢測性能;針對未知算法的檢測,提出基於半監督學習的隱寫分析方法,通過基於聚類的選擇性集成學習訓練協同分類器,提升算法的泛化能力。課題研究成果可套用於3G通信、移動網際網路以及VoIP通信中,實現對CELP壓縮語音的隱寫檢測。課題隱寫分析學習方法可為圖像視頻隱寫分析提供新思路。
結題摘要
本項目研究面向CELP語音壓縮域的通用隱寫分析方法。研究內容包括:通用隱寫分析特徵的提取;載體失配問題研究;未知隱寫算法的隱寫分析性能提升研究。本課題的主要研究結果如下: (1)通用隱寫分析特徵提取方面,以目前主流的CELP語音壓縮算法AMR為研究對象,對三個主要嵌入域:固定碼本(FBC)、基音周期(Pitch)和線性預測係數(LPC)的載體數據統計分布特性進行研究,提出三種隱寫分析特徵:針對固定碼本隱寫方法,基於隱寫導致同軌道非零脈衝位置條件機率發生改變,提出基於同軌道脈衝位置相同機率特徵SPP的隱寫分析方法。針對AMR基音周期隱寫方法,基於二階差分能有效區分離散信號波動程度的特點,提出基於二階差分統計特徵的隱寫分析方法。針對LPC隱寫方法,基於隱寫所引入的LPC量化碼字使用頻度和相鄰幀間LPC係數差值波動分布的特徵差異,提出基於碼字統計特徵的LPC隱寫分析方法。三種隱寫分析算法的檢測性能都較傳統算法有了明顯提升。 (2)針對載體失配問題,基於域自適應學習方法,分別從樣本層和特徵表示層提出解決方案。在特徵層,提出基於聚類分類的隱寫分析方法,通過對訓練樣本聚類,對每個聚類訓練子分類器,構建基於子分類器的決策融合隱寫分析方法;在樣本層,提出基於自動編碼器的樣本集合擴充方法,通過大量音頻樣本進行樣本特徵提取,選擇提升訓練樣本多樣性的優選算法模型對訓練樣本集合進行擴充,實現了對樣本集合的有效構建,提升了隱寫分析算法的泛化能力。 (3)針對未知隱寫算法的檢測性能提升問題,提出基於差異的半監督隱寫分析學習方法,將集成學習與半監督學習技術結合,通過多分類器間協同訓練,利用未標籤樣本提升分類器的泛化能力,提高了分類器的盲隱寫分析性能。 課題研究成果可套用於3G通信、移動網際網路以及VoIP通信中,實現CELP壓縮語音的隱寫檢測。由於CELP語音壓縮算法在原理上的相似性,課題研究所提出的三種隱寫分析特徵可推廣套用到其他CELP語音算法中,包括G.723.1, G.729, G.728, iLBC等。課題針對載體失配和未知隱寫算法的研究成果可套用在視頻和圖像隱寫分析中,為圖像視頻隱寫分析提供新的解決思路。