基於壓縮域聽覺譜的音頻分類與檢索算法研究

《基於壓縮域聽覺譜的音頻分類與檢索算法研究》是依託上海大學,由余小清擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於壓縮域聽覺譜的音頻分類與檢索算法研究
  • 項目類別:面上項目
  • 項目負責人:余小清
  • 依託單位:上海大學
  • 負責人職稱:副教授
  • 批准號:60872115
  • 研究期限:2009-01-01 至 2011-12-31
  • 申請代碼:F0111
  • 支持經費:26(萬元)
中文摘要
隨著網際網路及多媒體技術的發展,音頻數據量呈爆炸式增長,如何快速、準確地對音頻信息進行分類檢索,已成為急待解決的重要問題。目前網際網路及各種資料庫中的海量錄音音頻數據都以壓縮格式存儲,這些音頻大多並非在專業錄音棚中錄製,故在壓縮前混入了環境噪聲,壓縮過程同時引入了一定噪聲,噪聲的存在直接影響原有壓縮域提取特徵方法的表征準確度;壓縮音頻數據若解壓後再抗噪處理,不僅增加計算量,抗噪效果也不理想。針對這些問題,本項目申請提出,直接在壓縮域中模仿人耳對傳統頻譜的預處理操作來抑制噪聲,建立壓縮域聽覺譜數學模型,基於壓縮域直接提取高魯棒性能的聽覺譜音頻特徵,利用近似熵約簡算法對所提取的壓縮域聽覺譜特徵進行篩選和最佳化組合,研究基於熵的相似度度量方法及基於粒度的音頻分類檢索算法,為在壓縮域中準確、快速地對音頻信息進行分類和檢索提供一種新的有效方法。

相關詞條

熱門詞條

聯絡我們