《TRIP非結構化資料庫及其搜尋引擎技術與套用》是2014年出版的圖書,作者是練亞純。
基本介紹
- 中文名:TRIP非結構化資料庫及其搜尋引擎技術與套用
- 作譯者:練亞純
基本信息,內容簡介,圖書目錄,圖書前言,
基本信息
作 譯 者:練亞純
出版時間:2014-07
千 字 數:446
版 次:01-01
頁 數:256
開 本:16(185*260)
I S B N :9787121237034
內容簡介
本書以TRIP資料庫為例,系統闡述了非關係資料庫的基礎理論、基本技術和基本方法。除引言外,全書包括3篇內容。引言部分回顧資料庫技術的發展歷史,闡述非結構化資料庫的現實意義;資料庫篇共5章,包括非關係資料庫概述、TRIP系統概述、TRIP資料庫設計、資料庫的裝入與維護和TRIP資料庫的安全性控制;搜尋引擎篇共4章,包括TRIP的索引技術、TRIP資料庫檢索、搜尋相關的其他功能和TRIP資料庫的輸出格式;套用開發篇共3章,包括TRIP資料庫編程、TRIP資料庫編程實例和TRIP其他組件介紹。
圖書目錄
引言:漫話資料庫技術發展 1
0.1 非結構化資料庫的相關概念 1
0.2 資料庫技術發展簡略回顧 3
0.3 非結構化資料庫的現實意義 6
第1篇 資料庫篇
第1章 非關係資料庫概述 13
1.1 引言 13
1.2 非關係資料庫的基本概念和技術 14
1.2.1 非關係資料庫的基本概念 15
1.2.2 非關係資料庫中的關鍵技術 16
1.3 非關係資料庫現狀 22
1.4 幾種典型的非關係資料庫 22
1.4.1 分散式結構化數據表BigTable 22
1.4.2 Amazon的平台基礎存儲架構
Dynamo 29
1.4.3 BigTable和Dynamo的對比
分析 37
1.5 NoSQL的優勢與劣勢 38
1.6 TRIP全文資料庫系統 38
第2章 TRIP系統概述 39
2.1 TRIP系統基礎 39
2.1.1 TRIP系統構成 40
2.1.2 數據模型 42
2.1.3 數據組織 43
2.1.4 欄位類型 44
2.1.5 TRIP管理員 45
2.1.6 控制檔案 45
2.2 TRIP資料庫基礎 46
2.2.1 記錄與元記錄 46
2.2.2 檔案結構 48
2.2.3 用戶操作界面 51
習題2 54
第3章 TRIP資料庫設計 55
3.1 資料庫設計TRIPclassic 55
3.1.1 資料庫基本屬性 56
3.1.2 欄位定義 58
3.1.3 資料庫設計的保存、修改、
刪除與複製 63
3.1.4 庫組 64
3.2 資料庫設計—CCL命令方式 65
3.2.1 輸出資料庫結構 65
3.2.2 創建資料庫結構 67
3.3 資料庫設計—GUI方式 68
3.3.1 創建資料庫 68
3.3.2 欄位定義 71
3.3.3 資料庫的修改、刪除和複製 72
3.4 敘詞表 72
3.4.1 敘詞表的概念和用途 72
3.4.2 敘詞表的基本元素 74
3.4.3 TRIP敘詞表結構 75
3.4.4 創建敘詞表步驟 76
習題3 77
第4章 資料庫的數據裝入與維護 79
4.1 批量導入數據 79
4.1.1 Tform檔案格式 79
4.1.2 Tform數據的裝入與倒排 81
4.1.3 Tform數據建庫示例 81
4.2 線上錄入數據 83
4.2.1 錄入表單的設計 83
4.2.2 錄入表單的管理 85
4.2.3 數據線上錄入 86
4.3 資料庫的修改更新 86
4.3.1 錄入界面的線上修改 86
4.3.2 全局更新 87
4.3.3 利用Tform檔案的批量更新 88
4.4 資料庫的拆分合併與轉移 90
4.4.1 拆分資料庫 90
4.4.2 合併資料庫 91
4.4.3 資料庫記錄的轉移 91
4.5 資料庫光碟 91
4.5.1 數據光碟與資料庫光碟 91
4.5.2 建立資料庫光碟的基本要求 92
4.5.3 資料庫光碟的創建步驟 92
習題4 93
第5章 TRIP資料庫的安全性控制 94
5.1 安全性概述 94
5.2 用戶和用戶組的許可權管理 94
5.2.1 用戶 94
5.2.2 用戶組 97
5.3 資料庫的使用許可權管理 100
5.3.1 資料庫授權—TRIPclassic 101
5.3.2 資料庫授權—GUI 102
5.3.3 資料庫所有權的轉移 104
5.4 數據備份和恢復 105
5.5 日誌和審計 105
5.5.1 Tform檔案的LOG檔案 105
5.5.2 資料庫被檢索的日誌 108
5.5.3 資料庫維護日誌 108
習題5 109
第2篇 搜尋引擎篇
第6章 TRIP的索引技術 113
6.1 採用倒排表的信息檢索 113
6.2 哈希法 114
6.3 索引檔案內容 116
6.4 索引內容的存儲 117
習題6 118
第7章 TRIP資料庫檢索 119
7.1 TRIP資料庫檢索操作入門 119
7.2 基本檢索操作命令 121
7.2.1 帶運算符的檢索命令 121
7.2.2 在指定欄位範圍的查找 121
7.2.3 截斷檢索 121
7.2.4 對數值、日期、時間的檢索 122
7.2.5 用記錄號檢索 123
7.2.6 二次查找——利用過程號進
一步查找 123
7.2.7 檢索結果的顯示 124
7.3 高級檢索操作命令 125
7.3.1 整個phrase子欄位內容的
查找 125
7.3.2 一組欄位的查找 126
7.3.3 查找欄位內容重複的記錄 126
7.3.4 同一範圍內的查找 126
7.3.5 記錄“郵戳”的查找 127
7.3.6 多個資料庫的同時檢索 127
7.3.7 元組欄位的查找 129
7.3.8 查找命令過程的存儲 130
習題7 130
第8章 搜尋相關的其他功能 132
8.1 內容匯聚 132
8.2 索引詞瀏覽 135
8.3 詞義擴展 135
8.4 數值統計與數據分析 138
8.5 間接檢索 142
8.5.1 間接檢索概述 142
8.5.2 間接檢索的操作過程 142
8.5.3 間接檢索示例 143
8.6 詞表檢索 146
8.6.1 詞表檢索 147
8.6.2 詞表的調用顯示 148
8.6.3 用詞表的資料庫檢索 149
8.6.4 同義詞與跨語言查找 150
8.7 中文自動分詞 151
8.7.1 單漢字處理 151
8.7.2 中文自動分詞 152
8.7.3 分詞詞典及設定 153
8.7.4 分詞法選擇 154
習題8 156
第9章 TRIP資料庫的輸出格式 157
9.1 輸出模板的組成 157
9.2 創建輸出模板 158
9.2.1 輸出模板布局 159
9.2.2 背景文字 160
9.2.3 函式 161
9.2.4 頁面尺寸控制 168
9.2.5 輸出模板的生成、複製與
刪除 169
習題9 169
第3篇 套用開發篇
第10章 TRIP資料庫編程 173
10.1 TRIPnxp&TRIPjxp類庫介紹 173
10.2 會話 174
10.3 資料庫操作 175
10.4 數據操作 179
10.4.1 數據檢索 179
10.4.2 數據更新 184
10.5 用戶管理 189
10.6 用戶組管理 191
10.7 許可權管理 192
10.8 執行CCL命令 193
習題10 195
第11章 TRIP資料庫編程實例 196
11.1 系統任務的提出和設計思路 196
11.1.1 資料庫設計 196
11.1.2 界面設計 197
11.2 主要模組及實現 197
11.2.1 資料庫接口類DbKit 198
11.2.2 登錄模組 199
11.2.3 記錄添加模組 200
11.2.4 記錄刪除模組 201
11.2.5 記錄修改模組 202
11.2.6 記錄檢索模組 203
11.2.7 數據的顯示和刷新 203
習題11 204
第12章 TRIP其他組件介紹 205
12.1 TRIP的主要產品 205
12.2 TRIPview 205
12.3 連線池 209
12.4 TRIPagent 212
12.4.1 TRIPagent介紹 212
12.4.2 TRIPagent基本概念 213
12.4.3 TRIPagent的使用 214
12.5 TRIP檔案分類 218
12.6 TRIPgrid 221
12.6.1 作為存儲格線的TRIP 221
12.6.2 TRIP Web Service 222
12.6.3 管理TRIPgrid 222
習題12 223
附錄A CCL命令參考手冊 224
參考文獻 243
圖書前言
隨著網際網路和信息技術的發展,非結構化數據量呈幾何級數增長,尤其是隨著Web 2.0技術的流行,更加速了這種增長。如今大到網際網路、社交網、移動網,小至智慧型終端,到處充滿了非結構化數據;上至政府機關、企事業單位的計算機設備,下至個人計算機,隨處可見越積越多的各種格式電子文檔。信息社會已跨入大數據時代。 面對海量湧現的非結構化數據,如何有效地組織和管理?傳統的主流資料庫技術SQL實在難。