面向專業領域的情報工程技術研究與實現

面向專業領域的情報工程技術研究與實現

《 面向專業領域的情報工程技術研究與實現》是2020年科學技術文獻出版社出版的圖書,作者:劉耀。本書通過領域本體構建等信息技術的融合與集成,將化學工業的領域知識合理分類,構建以化學化工知識點為基本單元的圖書全文資料庫,為科學研究、技術開發、工程設計、工程套用、技術諮詢和專業學習用戶提供知識服務,實現智慧型檢索與知識語義導航,實現知識的共享與重用。

基本介紹

  • 中文名: 面向專業領域的情報工程技術研究與實現
  • 作者:劉耀
  • 出版社:科學技術文獻出版社
  • ISBN:9787518966387
內容簡介,圖書目錄,

內容簡介

專業領域知識體系構建系統:針對研究數位化、網路化環境檢索、利用化工知識的需要,通過領域本體構建等信息技術的融合與集成,將化學工業的領域知識合理分類,構建以化學化工知識點為基本單元的圖書全文資料庫,為科學研究、技術開發、工程設計、工程套用、技術諮詢和專業學習用戶提供知識服務,實現智慧型檢索與知識語義導航,實現知識的共享與重用。
護理科學大數據平台:利用大數據處理技術、自然語言處理技術、機器學習方法對已有公認領域知識進行重構利用,在構建領域本體的基礎上,利用語義標註技術實現資源結構化、語義化處理,為護理領域的從業人員提供資訊、科研、評價專業知識服務。系統主要功能包括行業前沿熱點資訊、知識檢索、科研報告、行業報告、對比式摘要、人才評價、期刊評價、機構評價等。
本書的具體研究內容如下。
①情報工程基礎框架(第1章),闡述情報工程的基礎框架,從文本到情報的處理過程中涉及的主要步驟流程。
②情報工程基本模型與算法(第2章),闡述從文本到情報的處理過程中涉及的主要模型與算法,包括結構化學習模型、主題發現模型、特徵選擇算法等。
③情報工程技術平台(第3章),闡述以“知識組織、數據驅動”為核心的情報工程處理支撐平台建設思路,以及情報工程技術平台的主要功能。
④對比式摘要自動生成(第4章),研究對比式摘要自動生成相關的方法與技術,包括模型定義、資源獲取、話題信息挖掘、摘要生成等。
⑤面向領域的研究綜述自動生成(第5章),研究面向領域的研究綜述自動生成的方法與技術,包括模型構建、資源蒐集原則及評價方法等。
⑥基於視頻的文本摘要自動生成(第6章),研究基於視頻的文本摘要自動生成的方法與技術,包括視頻結構化分析技術、視頻語義分析技術、文本摘要生成技術等。
⑦行業報告自動生成(第7章),研究行業報告自動生成的方法與技術,包括模型構建、指標設計、指標配置、指標統計等。
本書在編寫過程中,參閱了大量的圖書和文獻,汲取了很多精髓,特別是引用了部分圖表、數據等,在此向有關作者表示誠摯的感謝。在研究過程中也得到諸多業界專家、領導、同事的幫助和支持,在此一併致謝。筆者的碩士研究生黃毅、楊雨青、帥遠華、李澤垚、朱文文、張琢不同程度地參與了前期的數據處理工作;碩士研究生邢玉艷、謝若昀、房小瑋、張華珺、王亭亭、劉茹、李冠霖分別在系統測試及案例實現中做了大量的工作,在此一併表示感謝。同時,也向開發團隊人員及出版校對人員表示感謝。

圖書目錄

第1章 情報工程基礎框架 1
1.1 資源結構化 2
1.1.1 文本結構化 2
1.1.2 視頻結構化 5
1.2 資源語義化 13
1.2.1 文本語義化 13
1.2.2 視頻語義化 16
1.3 數據可視化 23
1.3.1 基於統計圖表的可視化 24
1.3.2 基於拓撲結構的可視化 30
1.3.3 基於聚類結構的可視化 31
1.3.4 基於標籤雲的可視化 31
1.4 本章小結 32
第2章 情報工程基本模型與算法 33
2.1 相似度模型 33
2.1.1 Word2Vec模型 33
2.1.2 Doc2Vec模型 40
2.1.3 LDA模型 46
2.2 機率模型與算法 53
2.2.1 CRF模型 54
2.2.2 TF-IDF算法 59
2.2.3 BM25算法 64
2.3 排序算法 67
2.3.1 PageRank算法 68
2.3.2 TextRank算法 74
2.4 視頻圖像處理模型與算法 85
2.4.1 感知哈希算法 85
2.4.2 FAST角點檢測算法 91
2.4.3 直方圖比較法 96
2.5 本章小結 107
第3章 情報工程技術平台 109
3.1 平台技術 109
3.1.1 網路信息採集平台 110
3.1.2 資源交換平台 113
3.1.3 Schema管理平台 115
3.1.4 資源加工平台 117
3.1.5 本體構建平台 121
3.2 系統功能 127
3.2.1 資訊查看 128
3.2.2 知識檢索 128
3.2.3 科研服務 132
3.3 平台運行軟硬體環境 138
3.4 本章小結 138
第4章 對比式摘要自動生成 140
4.1 思路與框架 140
4.2 開放平台領域話題知識與文獻處理 143
4.2.1 領域話題知識處理 143
4.2.2 領域科學文獻處理 147
4.2.3 雙話題比較信息挖掘 148
4.3 比較摘要生成步驟 153
4.3.1 結合先驗知識的子主題排序 153
4.3.2 結合文獻外部信息的候選句排序 154
4.3.3 摘要文本生成 155
4.4 實驗與分析 155
4.5 本章小結 156
第5章 面向領域的研究綜述自動生成 157
5.1 思路與框架 157
5.1.1 文獻綜述的定義 158
5.1.2 文獻綜述的結構 159
5.2 資源語義化處理 159
5.2.1 領域本體構建 159
5.2.2 語義標籤自動標註 161
5.3 綜述生成流程步驟 162
5.3.1 綜述基礎模型構建 162
5.3.2 綜述模板構建 166
5.3.3 綜述標題與內容生成 166
5.4 自動綜述的結果評價 170
5.4.1 自動摘要的評價方法 170
5.4.2 自動綜述的評價方法 172
5.4.3 實驗與分析 175
5.5 本章小結 176
第6章 基於視頻的文本摘要自動生成 177
6.1 思路與框架 177
6.2 視頻資源結構化處理 178
6.2.1 視頻鏡頭分割 179
6.2.2 視頻關鍵幀提取 180
6.3 視頻資源語義分析 182
6.3.1 視頻關鍵幀分類 182
6.3.2 視頻主題單元劃分 186
6.4 視頻摘要生成流程 187
6.4.1 主題單元文本預處理 190
6.4.2 節點邊權值計算 190
6.4.3 節點權重計算 192
6.4.4 節點權重最佳化 193
6.4.5 主題排序與摘要句抽取 195
6.4.6 摘要生成 196
6.5 實驗與分析 198
6.5.1 摘要結果對比 198
6.5.2 評價標準 199
6.5.3 評價指標對比與分析 199
6.6 本章小結 201
第7章 行業報告自動生成 202
7.1 思路與框架 202
7.2 異構資源處理 203
7.2.1 科技文獻解析標準 204
7.2.2 綜合資源模板 204
7.2.3 資源解析實例 206
7.2.4 簡單欄位統計實例 207
7.3 行業報告生成流程 209
7.3.1 模板設計 209
7.3.2 指標設計 212
7.4 實驗與分析 218
7.5 本章小結 222
附錄 運行算法具體示例 223
圖表目錄 237
參考文獻 245

相關詞條

熱門詞條

聯絡我們