多媒體信息檢索與管理

多媒體信息檢索與管理

《多媒體信息檢索與管理》是2009年清華大學出版社出版的圖書,作者是馮大淦,蕭允治,張宏江。

基本介紹

  • 書名:多媒體信息檢索與管理
  • 作者:馮大淦,蕭允治,張宏江 著,
  • 譯者:劉曉冬 譯
  • ISBN:9787302211617
  • 定價:¥59.00
  • 出版社清華大學出版社
  • 出版時間:2009-11-1
  • 開本:16開
內容簡介,目錄,

內容簡介

本書適用讀者很廣泛。對於想學習和了解計算機多媒體信息檢索和管理的本科生、研究生,本書可作為他們的教材或教學參考書。對於那些從事計算機多媒體信息檢索和管理工程領域的研究開發人員、技術服務人員和用戶等,本書也是一本很好的參考書。
本書是一本關於多媒體信息檢索和管理領域的經典著作,傾注了該領域世界眾多知學者的研究成果和貢獻,在國外許多重點大學作為計算機專業本科生和研究生的教材。本書填補了我國在該研究領域譯著的空白。本書從理論基礎和實踐套用兩個方面對當前流行的多媒體信息檢索和管理領域的技術和系統進行了完整和詳細地介紹。全書共分兩大篇,即技術基礎篇和套用篇,共21章,內容包括對於數字音頻音樂、圖像和視頻基於內容檢索的一套完整的技術;多媒體低級特徵提取和高級語義描述,以及最新的MPEG一7標準;多媒體認證和水印;廣泛的實際套用(例如,數字圖書館、醫學圖像和生物特徵識別等)。

目錄

第1章基於內容的圖像檢索基礎 3
1.1引言 3
1.2圖像內容描述符 4
1.2.1顏色 5
1.2.2紋理 8
1.2.3形狀 12
1.2.4空間信息 15
1.3相似度測量和索引方案 15
1.3.1相似度/距離測量 15
1.3.2索引方案 17
1.4用戶互動 18
1.4.1查詢說明 18
1.4.2相關反饋 18
1.5性能評價 19
1.6結論 20
參考文獻 21
第2章基於內容的視頻分析、檢索和瀏覽 26
2.1引言 26
2.2視頻結構分析 27
2.2.1鏡頭邊界檢測 28
2.2.2場景分組 30
2.2.3情節分割 30
2.3視頻內容表達 31
2.3.1基於關鍵幀的表達 32
2.3.2基於鏡頭的表達 32
2.4視頻提取和視頻摘要 39
2.4.1關鍵幀抽取 39
2.4.2視頻高亮顯示 41
2.5基於內容的視頻檢索和瀏覽 42
2.5.1相似性度量 42
2.5.2鏡頭聚類 44
2.5.3瀏覽方案 44
2.6結論 46
致謝 47
參考文獻 47
第3章基於內容的圖像檢索的相關反饋 51
3.1引言 51
3.2相關反饋算法 52
3.2.1經典算法 52
3.2.2作為學習問題的相關反饋 53
3.2.3帶記憶的相關反饋 56
3.3一個集成相關反饋框架 57
3.3.1語義網路 58
3.3.2集成和跨模態查詢和檢索 59
3.3.3機率傳播方案 60
3.3.4實驗結果 61
3.4結論 62
致謝 63
參考文獻 63
第4章結構和語義層次的視頻分析和摘要 66
4.1引言 66
4.2場景分析 67
4.2.1計算場景定義 67
4.2.2方法 69
4.3事件分析 71
4.3.1方法 71
4.4視頻摘要 73
4.4.1圖像故事板 73
4.4.2縮略視頻 74
4.4.3“最優”摘要存在嗎 77
4.5結論 78
致謝 79
參考文獻 79
第5章數字音頻和音樂的基於內容的檢索 83
5.1引言 83
5.2音頻特徵抽取 84
5.2.1聲學特徵 84
5.2.2主觀/語義特徵 85
5.3一般音頻分類和檢索 86
5.3.1基於內容的音頻分割 86
5.3.2基於內容的音頻檢索 87
5.4音樂內容分析 88
5.4.1音樂分割 88
5.4.2音樂類型分類 89
5.4.3音樂摘要 89
5.4.4樂器鑑定 90
5.4.5音樂標註 91
5.5基於內容的音樂檢索 92
5.6案例研究 93
5.6.1基於內容的音頻檢索 93
5.6.2基於內容的音樂哼唱檢索 97
5.7結論 100
5.7.1從錄音中提取旋律 100
5.7.2檢索精度 101
5.7.3基於Web的搜尋引擎 101
致謝 101
參考文獻 101
第6章MPEG-7多媒體內容描述標準 105
6.1引言 105
6.2背景和套用 106
6.2.1MPEG背景 106
6.2.2MPEG-7套用 107
6.3MPEG-7結構 109
6.3.1MPEG-7組成部分 109
6.3.2MPEG-7基本結構 109
6.3.3MPEG-7可擴展性 110
6.4MPEG-7概念模型 111
6.5MPEG-7描述定義語言 112
6.6MPEG-7多媒體描述方案 113
6.6.1基本元素 114
6.6.2內容描述工具 114
6.6.3內容組織、導航和訪問、用戶互動 114
6.6.4分類方案 115
6.6.5例子 115
6.7MPEG-7音頻描述工具 119
6.7.1低層次音頻工具 119
6.7.2高層次音頻工具 120
6.7.3例子 120
6.8MPEG-7視覺描述工具 122
6.8.1顏色 122
6.8.2紋理 122
6.8.3形狀 123
6.8.4運動 123
6.8.5定位 123
6.8.6人臉 123
6.8.7例子 123
6.9MPEG-7的未來 125
參考文獻 125
第7章多媒體認證和水印技術 129
7.1引言 129
7.2多媒體認證範例 131
7.2.1需求 131
7.2.2對多媒體認證系統的攻擊 132
7.3多媒體認證方案 133
7.3.1使用脆弱水印的硬多媒體認證 133
7.3.2使用半脆弱水印的軟多媒體認證 137
7.3.3基於內容的認證 140
7.4結論 147
參考文獻 147
第8章索引和檢索高維視覺特徵 151
8.1引言 151
8.2R樹家族 154
8.3CSS+樹 155
8.3.1CSS+樹的一般結構 155
8.3.2CSS+樹的批量載入 156
8.3.3CSS+樹的動態行為 158
8.3.4同其他層次化結構的比較 160
8.4處理不同的距離度量 161
8.4.1用加權歐氏距離進行k-nn搜尋的方法 162
8.4.2到高維空間的擴展 163
8.4.3實驗結果和討論 163
8.5降維 164
8.5.1使用混合聯想神經網路降維 165
8.5.2降維結果 166
8.6結論 168
參考文獻 169
第9章多媒體資料庫的語義數據建模機制 172
9.1引言 172
9.2語義和多媒體數據建模技術 174
9.2.1多媒體資料庫技術 174
9.2.2面向對象的視圖機制 174
9.2.3動態對象模型 175
9.3MediaView:一種語義建模機制 176
9.3.1概貌 176
9.3.2MediaView的基本原理 177
9.3.3視圖運算元 180
9.3.4視圖推導機制 181
9.4MediaView的套用 184
9.4.1多媒體查詢 184
9.4.2“媒體地圖”中的導航 186
9.4.3存儲和索引的最佳化 187
9.5結論 187
參考文獻 188
第10章可視化資料庫系統中基於特徵的檢索 190
10.1引言 190
10.2可視化資料庫系統設計 191
10.3元數據層次 193
10.3.1特徵索引 194
10.3.2聚類和模板 196
10.3.3異類特徵的聚類 196
10.4異類特徵的查詢 199
10.4.1使用異類特徵排序圖像 200
10.4.2合併異類特徵 202
10.4.3相關反饋的集成 202
10.5結論 203
致謝 204
參考文獻 204
第2部分套用篇
第11章數字圖書館 209
11.1數字圖書館定義 209
11.2數字圖書館創新工程(第一階段) 211
11.3DLI項目 212
11.3.1卡內基梅隆大學“視頻的全內容搜尋和檢索” 212
11.3.2伊利諾斯大學烏爾班納-香巴尼分校“科學文獻的聯合知識庫” 215
11.3.3史丹福大學“異類服務中的互操作機制” 217
11.4DLI二期 219
11.4.1以人為中心的研究 220
11.4.2基於內容和館藏的研究 220
11.4.3以系統為中心的研究 221
11.4.4建立測試平台 221
11.4.5總結 222
11.5結論 222
參考文獻 222
第12章數字圖書館的可擴展存儲 225
12.1引言 225
12.2動機 226
12.3主題領域 226
12.4本地檔案系統 227
12.5工作負載研究 227
12.6本地檔案系統性能問題 230
12.6.1高速快取 230
12.6.2聚集和分裂 231
12.6.3塊尺寸和分配 231
12.6.4日誌結構的方法 232
12.7磁碟陣列 232
12.8網路化存儲 236
12.8.1智慧型磁碟 237
12.8.2並行檔案系統 238
12.8.3分散式檔案系統 239
12.9結論 241
參考文獻 241
第13章數字圖書館的對象知識庫 247
13.1引言 247
13.2數字對象與檔案 248
13.3命名和定位 249
13.3.1唯一性與定位依賴性 249
13.3.2統一資源名稱 250
13.3.3可擴展的對象定位 251
13.4可靠性冗餘編碼 252
13.5元數據 253
13.5.1桶 254
13.5.2條款和條件 254
13.6數字對象知識庫 255
13.6.1KAHN-WILENSKY及其擴展 256
13.6.2其他的知識庫方法 257
13.7結論 258
參考文獻 259
第14章全球資訊網上的信息發現 263
14.1引言 263
14.2Web結構挖掘 267
14.2.1權威和樞紐 267
14.2.2錨點 268
14.2.3網頁排名 271
14.3Web日誌挖掘 272
14.3.1用戶模型 272
14.3.2網際網路GLOSS 273
14.4結論 276
參考文獻 276
第15章協同多媒體信息系統 278
15.1引言 278
15.1.1協同多媒體信息系統定義 279
15.1.2多媒體信息系統的分類 279
15.2協同多媒體信息系統回顧 280
15.2.1多媒體會議 280
15.2.2集成工具集 283
15.3體系結構實例 285
15.3.1MARRATECH 285
15.3.2多媒體互動式遠程學習系統 286
15.3.3會議紀要系統 287
15.3.4TEAMSMART 287
15.4管理問題 289
15.5結論 291
參考文獻 291
第16章圖片存檔及通信系統、圖像管理和影像信息學 297
16.1圖片存檔及通信系統(PACS)基礎 297
16.1.1PACS組件 297
16.1.2醫學圖像 299
16.1.3術語和標準 300
16.1.4IHE和PACS數據流 301
16.1.5HIS/CMS和電子病歷 301
16.2圖像數據通信和管理 302
16.2.1圖像通信 302
16.2.2大尺度圖像數據管理 305
16.3影像信息學 307
16.3.1醫學影像信息學基礎設施 307
16.3.2NCM—神經外科病人數據的管理 309
16.4總結 311
16.5結論 311
致謝 312
參考文獻 312
第17章醫學數據基於內容的檢索 313
17.1引言 313
17.2一維醫學數據基於內容的檢索 314
17.3二維醫學數據基於內容的檢索 315
17.4三維醫學數據基於內容的檢索 316
17.5四維醫學數據基於內容的檢索 318
17.5.1示蹤劑動力學特徵提取和數據壓縮 319
17.5.2四維功能圖像檢索系統 321
17.5.3案例研究 323
17.6結論 324
致謝 325
參考文獻 325
第18章使用掌紋圖像的生物特徵檢索 329
18.1引言 329
18.2動態特徵選擇 335
18.3分式判別函式 336
18.4分層掌紋匹配 337
18.5實驗結果 340
18.6結論 341
致謝 342
參考文獻 342
第19章在人臉資料庫中查找人臉 344
19.1人臉識別:綜述和挑戰 344
19.1.1自動人臉識別的套用 344
19.1.2人臉識別系統的結構 345
19.2特徵臉 346
19.3複雜背景中的人臉檢測 347
19.3.1顏色空間 347
19.3.2類似人臉區域的分割 348
19.4面部特徵檢測和提取 352
19.4.1提取人臉輪廓 353
19.4.2變形模板 355
19.5從人臉資料庫中搜尋人臉 358
19.5.1基於特徵臉的人臉識別 358
19.5.2使用豪斯多夫距離度量的人臉識別 359
19.6結論 363
參考文獻 364
第20章活體植物識別的數據管理 366
20.1引言 366
20.1.1植物識別和智慧型信息處理 367
20.1.2植物數據管理 367
20.2植物學家識別植物的方法 367
20.3植物識別和植物數據管理系統 369
20.3.1Lucid:多媒體知識管理工具 369
20.3.2Uconn植物資料庫 369
20.3.3CalFlora:維管植物資料庫 370
20.3.4計算機輔助植物識別系統 370
20.4植物圖像處理和特徵提取 371
20.4.1葉子圖像處理 371
20.4.2花圖像處理 375
20.5葉子與花的圖像檢索 377
20.5.1葉子圖像檢索 377
20.5.2花圖像檢索 381
20.6結論 384
參考文獻 384
第21章廣播視頻的快速啟動與互動式檢索 387
21.1引言 387
21.2通用廣播方案 389
21.2.1錐形廣播方案 390
21.2.2摩天樓廣播方案 390
21.2.3貪心磁碟節約型廣播方案 390
21.3預取模式——積極的與適時的 391
21.4快進和向前跳讀 392
21.4.1短程快進廣播方案 393
21.4.2主動緩衝區管理方案 395
21.4.3鏡像錐形廣播方案 396
21.4.4向前跳讀 397
21.5暫停-重新開始、倒帶和向後復位 397
21.6結論 398
致謝 398
參考文獻 399

相關詞條

熱門詞條

聯絡我們