《海量數據管理――文檔和圖像的壓縮和索引》是1996年科學出版社出版的圖書,作者是(美)[I.H.威滕]Ian H.Witten。
基本介紹
- 作者:Lan H.Witten(美)
- 譯者:張仲穎/等
- ISBN:9787030055231
- 頁數:317
- 定價:33.00
- 出版社:科學出版社
- 出版時間:1996-08
- 裝幀:平裝
內容介紹,作品目錄,
內容介紹
內容提要
本書是一本討論如何管理海量數據的專著,主要內容涉及文檔和圖像的壓縮和索
引:概述、文本壓縮、索引、查詢、索引構造、圖像壓縮、文本圖像、文本與圖像混合、實現
和信息爆炸,最後是mg系統指南及辭彙表。
本書適用於對計算機套用、資料庫設計與管理、圖像處理和文字處理感興趣的廣大
技術人員,還適用於大中專院校師生。
作品目錄
目錄
第一章 概述
1.1文檔資料庫
1.2文檔壓縮
1.3索引
1.4文檔圖像
1.5海量文檔管理系統
1.6進一步閱讀
第二章 文本壓縮
2.1模型
2.2自適應模型
2.3編碼
2.4符號模型
2.5字典模型
2.6同步
2.7性能比較
2.8進一步閱讀
第三章 索引
3.1樣本文檔集合
3.2倒置檔案索引
3.3倒置檔案壓縮
3.4索引壓縮方法性能
3.5署名檔案和點陣圖
3.6字型轉換及詞根化和無用詞
3.7索引方法比較
3.8進一步閱讀
第四章 查詢
4.1詞典訪問
4.2部分指定查詢術語
4.3布爾查詢處理
4.4排列及信息檢索
4.5檢索有效性估算
4.6餘弦法的實現
4.7互動式檢索
4.8進一步閱讀
第五章 索引構造
5.1基於記憶體的倒置
5.2基於排序分類的倒置
5.3使用索引壓縮
5.4壓縮記憶體中倒置
5.5索引方法的對比
5.6構造署名檔案和點陣圖
5.7動態集合
5.8進一步閱讀
第六章 圖像壓縮
6.1圖像類型
6.2二值圖像的CCITT傳真標準
6.3基於上下文的二值圖像壓縮
6.4JBIG:二值圖像的標準
6.5JPEG:連續色調圖像的標準
6.6灰度圖像的無損壓縮
6.7圖像的遞增傳輸
6.8圖像壓縮技術小結
6.9進一步閱讀
第七章 文本圖像
7.1文本圖像壓縮的概念
7.2有損及無損壓縮
7.3標誌提取
7.4模板匹配
7.5從標誌到符號
7.6對文本圖像的成分進行編碼
7.7性能:有損及無損模式
7.8對系統的考慮
7.9進一步閱讀
第八章 混合圖文
8.1確定方向
8.2分割
8.3分類
8.4進一步閱讀
第九章 實現
9.1文本壓縮
9.2文本壓縮性能
9.3圖像和文本圖像
9.4索引構造
9.5索引壓縮
9.6查詢處理
9.7進一步閱讀
第十章 信息爆炸
10.1信息技術發展兩千年
10.2Internet:一種全球信息資源
10.3紙張問題
10.4面對信息爆炸
10.5使海量數據管理更好
10.6對生活的個人信息支持
10.7進一步閱讀
附錄A mg系統指南
A.1mg系統安裝
A.2存儲和檢索的例子
A.3資料庫生成
A.4查詢一個索引後的檔案集
A.5非文本檔案
A.6圖像壓縮程式
辭彙表
第一章 概述
1.1文檔資料庫
1.2文檔壓縮
1.3索引
1.4文檔圖像
1.5海量文檔管理系統
1.6進一步閱讀
第二章 文本壓縮
2.1模型
2.2自適應模型
2.3編碼
2.4符號模型
2.5字典模型
2.6同步
2.7性能比較
2.8進一步閱讀
第三章 索引
3.1樣本文檔集合
3.2倒置檔案索引
3.3倒置檔案壓縮
3.4索引壓縮方法性能
3.5署名檔案和點陣圖
3.6字型轉換及詞根化和無用詞
3.7索引方法比較
3.8進一步閱讀
第四章 查詢
4.1詞典訪問
4.2部分指定查詢術語
4.3布爾查詢處理
4.4排列及信息檢索
4.5檢索有效性估算
4.6餘弦法的實現
4.7互動式檢索
4.8進一步閱讀
第五章 索引構造
5.1基於記憶體的倒置
5.2基於排序分類的倒置
5.3使用索引壓縮
5.4壓縮記憶體中倒置
5.5索引方法的對比
5.6構造署名檔案和點陣圖
5.7動態集合
5.8進一步閱讀
第六章 圖像壓縮
6.1圖像類型
6.2二值圖像的CCITT傳真標準
6.3基於上下文的二值圖像壓縮
6.4JBIG:二值圖像的標準
6.5JPEG:連續色調圖像的標準
6.6灰度圖像的無損壓縮
6.7圖像的遞增傳輸
6.8圖像壓縮技術小結
6.9進一步閱讀
第七章 文本圖像
7.1文本圖像壓縮的概念
7.2有損及無損壓縮
7.3標誌提取
7.4模板匹配
7.5從標誌到符號
7.6對文本圖像的成分進行編碼
7.7性能:有損及無損模式
7.8對系統的考慮
7.9進一步閱讀
第八章 混合圖文
8.1確定方向
8.2分割
8.3分類
8.4進一步閱讀
第九章 實現
9.1文本壓縮
9.2文本壓縮性能
9.3圖像和文本圖像
9.4索引構造
9.5索引壓縮
9.6查詢處理
9.7進一步閱讀
第十章 信息爆炸
10.1信息技術發展兩千年
10.2Internet:一種全球信息資源
10.3紙張問題
10.4面對信息爆炸
10.5使海量數據管理更好
10.6對生活的個人信息支持
10.7進一步閱讀
附錄A mg系統指南
A.1mg系統安裝
A.2存儲和檢索的例子
A.3資料庫生成
A.4查詢一個索引後的檔案集
A.5非文本檔案
A.6圖像壓縮程式
辭彙表