媒體計算與內容分析

媒體計算與內容分析

《媒體計算與內容分析》是2011年12月1日清華大學出版社出版的圖書,作者是魏維,本書集原理、技術套用為一體,同時有實驗分析和原型系統構建,是作者多年來從事圖形圖像處理與內容分析與理解的相關科研和承擔研究生相關課程教學工作的積累。

基本介紹

  • 書名:媒體計算與內容分析
  • 作者:魏維
  • ISBN:9787302261056
  • 類別:計算機理論、基礎知識
  • 出版社:清華大學出版社
  • 出版時間:2011-12-01
  • 裝幀:平裝
  • 開本:16開
  • 版次:1
內容簡介,圖書目錄,

內容簡介

媒體計算是指對視頻、音頻、圖像、圖形、文字等各類媒體信息進行內容分析的計算理論、算法和套用技術,包括各類媒體信息的表示、內容分析與識別算法等內容。本書內容覆蓋了媒體內容分析與理解相關的理論和套用技術,共分為11章。第1章介紹現有媒體內容分析與理解現狀;第2章主要介紹媒體計算理論及模型;第3章介紹了視頻內容分析的內容(視頻內容分析的前處理);第4~6章主要介紹基於統計學理論的視音頻內容分析,包括視覺語義分析與理解、音頻語義分析與理解以及視頻語義分析兩級多模式信息融合;第7~11章介紹基於認知機理,從場景整體語義的角度來理解、標註和分析媒體內容和語義概念,包括強依賴關聯關係提取、多標記語義標註、媒體場景顯著計算、媒體語義相似性計算、媒體顯著對象語義本體標註方法等內容。
《媒體計算與內容分析》本書主要讀者對象為從事圖形圖像處理的研究人員、大專院校計算機專業及相關專業師生、從事媒體信息處理研究與開發的科研人員和工程技術人員。

圖書目錄

第1章 緒論
1.1 引言
1.2 媒體/視頻語義預處理
1.3 現有媒體內容分析與理解現狀
1.3.1 機器學習/模式分類方法
1.3.2 統計學習方法
1.3.3 基於規則推理的方法
1.3.4 結合特定領域特點的方法
1.3.5 結合語義語境和語義關係進行內容理解的方法
1.3.6 結合語義知識理解媒體內容的方法
1.3.7 其他方法
1.3.8 體育媒體標註
1.4 視頻檢索評測
1.5 LSCOM與MediaMill
1.6 本章小結
第2章 媒體計算理論及模型
2.1 隱馬爾可夫模型
2.1.1 賭場真假骰子例子
2.1.2 模型描述
2.1.3 三個基本問題的解決方法
2.1.4 Baum-Welch重估公式的理論基礎
2.1.5 HMM在語音識別領域的套用
2.2 支持向量機
2.2.1 二維平面中的分類實例
2.2.2 VC維
2.2.3 結構風險最小化
2.2.4 線性分類
2.2.5 核函式與支撐向量機
2.2.6 相關推導與講解
2.3 本體論與知識表示
2.3.1 本體基本理論
2.3.2 Ontology的描述語言
2.3.3 本體構建
2.3.4 本體映射
2.3.5 已有的Ontology及其分類
2.3.6 WordNet
2.3.7 WordNet名詞組織形式
2.4 媒體內容分析中的腦認知理論
2.4.1 顯著圖
2.4.2 顯著圖自動定位
2.4.3 視覺顯著生理機制
2.4.4 顯著性計算的簡單框架
2.4.5 神經中樞與動作關聯
2.5 信息理論相似性定義
2.6 本章小結
第3章 視頻內容分析
3.1 引言
3.2 鏡頭檢測分割
3.2.1 基於統計分布的漸變鏡頭檢測與分割
3.2.2 特徵提取和測量準則的建立
3.2.3 漸變鏡頭邊界檢測
3.2.4 實驗與分析
3.3 運動視頻對象分割
3.3.1 全局運動計算與補償
3.3.2 對象分割
3.3.3 實例實驗
3.4 低層特徵提取
3.4.1 靜態可視特徵
3.4.2 運動特徵
3.4.3 音頻特徵
3.4.4 實驗與分析結果
3.5 本章小結
第4章 視覺語義分析與理解
4.1 引言
4.2 基於時空注意力模型的視覺語義分析
4.2.1 注意力機制選擇顯著區域
4.2.2 可視基本對象識別
4.2.3 可視基本對象分類識別的特徵選擇
4.2.4 實驗分析
4.3 具有多峰常態分配屬性的基本可視對象識別
4.3.1 貝葉斯相關理論及解決思路
4.3.2 定步長組合劃分方法
4.3.3 實驗及計算複雜度分析
4.3.4 實驗結論
4.4 高層視覺語義分析
4.4.1 高層視覺語義模型構建
4.4.2 關鍵幀策略與時間線語義語境約束線索
4.4.3 模型描述
4.4.4 時間語義的可觀察符號
4.4.5 實驗結果與分析
4.5 本章小結
第5章 音頻語義分析與理解
5.1 引言
5.2 基本聲音語義分析
5.2.1 模型選擇與描述
5.2.2 基本聲音語義識別系統解決方案
5.2.3 譜特徵提取
5.2.4 基本聲音語義模型訓練
5.2.5 基本聲音語義識別
5.2.6 實驗與分析
5.3 音頻高層語義分析
5.3.1 音頻高層語義建模
5.3.2 音頻高層語義提取
5.3.3 實驗與分析
5.4 本章小結
第6章 視頻語義分析兩級多模式信息融合
6.1 引言
6.2 模式劃分與融合原理
6.3 融合模型與算法
6.4 實驗分析
6.5 本章小結
第7章 強依賴關聯關係提取
7.1 引言
7.2 強依賴關聯語義關係提取
7.2.1 語義概念間關聯關係形式化描述
7.2.2 視頻語義強依賴關聯關係提取算法
7.3 實驗與分析
7.3.1 視頻鏡頭強關聯依賴關係提取實驗
7.3.2 LSCOM數據集中強依賴關係提取實驗
7.4 本章小結
第8章 多標記語義標註
8.1 引言
8.2 多標記學習研究現狀
8.3 多標記學習
8.4 多標記標註方法
8.5 評價指標
8.6 實驗與分析
8.7 本章小結
第9章 媒體場景顯著計算
9.1 引言
9.2 基於場景的顯著計算方法
9.3 靜態顯著計算
9.3.1 建立多尺度特徵空間
9.3.2 提取早期視覺特徵圖
9.3.3 顯著圖正規化處理
9.4 運動對象分割
9.5 動態顯著圖
9.6 脈衝耦合神經網路
9.6.1 脈衝耦合神經網路結構
9.6.2 PCNN參數確定
9.6.3 PCNN動靜顯著融合
9.7 實驗與分析
9.7.1 場景動靜態顯著計算實驗
9.7.2 顯著計算對比實驗
9.8 本章小結
第10章 媒體語義相似性計算
10.1 引言
10.2 媒體語義概念間語義相似性計算
10.2.1 相似度相關概念
10.2.2 現有語義相似性計算方法
10.2.3 媒體語義相似性計算原理
10.2.4 媒體語義概念相似性度量
10.3 媒體場景語義相似性計算
10.4 實驗與分析
10.4.1 視覺特徵直接計算語義相似性實驗
10.4.2 媒體語義相似性計算實驗
10.5 本章小結
第11章 媒體顯著對象語義本體標註方法
11.1 引言
11.2 媒體顯著對象本體語義標註
11.3 語義場景分割
11.4 靜態顯著對象分割
11.4.1 種子區域生長
11.4.2 注意力種子選擇
11.5 層次本體語義標註
11.6 實驗與分析
11.6.1 層次語義標籤標註實驗
11.6.2 媒體顯著本體語義標註實驗
11.7 本章小結
附錄A 圖清單
附錄B 表清單
附錄C 縮略詞及中英文辭彙對照
參考文獻
後記

相關詞條

熱門詞條

聯絡我們