《非結構化數據處理技術及套用》是2017年科學出版社出版的圖書,作者是陳燕、李桃迎、張金松。
基本介紹
- 中文名:非結構化數據處理技術及套用
- 作者:陳燕、李桃迎、張金松
- 出版社:科學出版社
- 出版時間:2017年12月
- ISBN:9787030531889
圖書簡介
圖書目錄
- 基礎知識篇
- 結構化數據挖掘技術篇
- 非結構化數據挖掘方法及套用篇
《非結構化數據處理技術及套用》是2017年科學出版社出版的圖書,作者是陳燕、李桃迎、張金松。
傳統關係資料庫主要面向事務處理和數據分析套用領域,擅長解決結構化數據管理問題,在管理非結構化數據方面存在某些先天不足之處,尤其在處理海量非結構化信息時更是面臨巨大挑戰。為了應對非結構化數據管理的挑戰,出現了各種非結構化數據管理...
《TRIP非結構化資料庫及其搜尋引擎技術與套用》是2014年電子工業出版社出版的圖書,作者是練亞純。內容簡介 本書以TRIP資料庫為例,系統闡述了非關係資料庫的基礎理論、基本技術和基本方法。除引言外,全書包括3篇內容。引言部分回顧數據...
非結構化信息處理類似於上世紀70年代以前的結構化信息套用。割裂、無法進行數據互操作的套用是其主流。以人們最常用的文檔軟體來看,DOC文檔是MSWORD與WPS的專用格式,永中、中文2000等OFFICE產品廠商則各有各的“自留地”。這種情況下,...
《大規模非結構化數據的智慧型存儲管理與檢索關鍵技術》是依託中國人民大學,由張孝擔任項目負責人的面上項目。項目摘要 Web環境下網頁、多媒體、電子文檔等非結構化數據已經達到PB級並蘊含大量信息和巨大價值,比如視頻監控數據還可以用來跟蹤...
有大量的數據需要處理 非結構化數據在任何地方都可以得到。這些數據可以在你公司內部的郵件信息、聊天記錄以及蒐集到的調查結果中得到,也可以是你對個人網站上的評論、對客戶關係管理系統中的評論或者是從你使用的個人應用程式中得到的文本...
資料庫 是指其欄位長度可變,並且每個欄位的記錄又可以由可重複或不可重複的子欄位構成的資料庫,用它不僅可以處理結構化數據(如數字、符號等信息)而且更適合處理非結構化數據(全文文本、圖象、聲音、影視、超媒體等信息)。
《非結構化管理決策大數據平台構建與關鍵技術》是依託北京工業大學,由丁治明擔任項目負責人的重大研究計畫。項目摘要 本項目擬針對管理決策中大數據的類型多樣性、相互關聯性、全景呈現性、模型計算性等特點,研究非結構化管理決策大數據平台...
《非結構化數據管理若干關鍵技術研究》是依託清華大學,由王建民擔任項目負責人的面上項目。項目摘要 本課題面向網路化套用對非結構化數據管理需求,重點突破非結構化數據一體化管理核心技術,研製非結構化數據管理系統,並在電信服務領域...
本書主要講述基於人工智慧、機器學習、深度學習等技術的非結構化數據分析如何在用戶獲取與留存、欺詐檢測和預防、人力資源管理、法律、醫療、產品和服務開發、國家安全以及體育等行業領域獲得套用。內容簡介 在當今全球互聯的時代,大多數企業...
項目的研究工作基於項目組成員多年來對於分散式和P2P系統中的查詢處理、Web數據管理、集群環境中的數據存儲與索引研究工作,是現有研究的自然延續。項目目標明確,可行性較強。結題摘要 海量非結構化數據的管理是新型數據密集型套用中碰到的...
與結構化數據相反,非結構化數據是指無固定格式的數據,例如,文本、網頁、圖像、視頻、數據流、序列、社交網路、圖結構等。現有數據中絕大多數數據都是非結構化數據。本書介紹了四種典型非結構化數據的分析和挖掘技術,分別是:文本數據...
《地質非結構化數據挖掘技術研究與實踐》是地質出版社出版的圖書。作者:中國地質調查局發展研究中心地質調查主流程信息化團隊 日期:2018.3 簡介:經過百年的地質工作和近半個世紀的信息化建設,地質調查積累了海量數據,並進入數據密集型...
《非結構化數據管理系統技術要求》是2016年11月1日實施的一項中國國家標準。編制進程 2016年4月25日,《非結構化數據管理系統技術要求》發布。2016年11月1日,《非結構化數據管理系統技術要求》實施。起草工作 主要起草單位:浙江大學、...
根據 IDC 網際網路數據中心2014年報告統計,全球數據正呈現指數級增長,預計到2020年數據總量將達到44ZB,其中超過80%的企業相關信息都是以非結構化或半結構化的形式存在的。目前配電網仍缺乏高效的大數據處理及分析存儲技術。在能源網際網路...
按專家的說法,信息基本上可分為結構化數據、書面文檔和流媒體三大類,其中結構化數據占20%左右,其餘占80%左右。隨著信息技術的深入套用,文檔互操作已成為軟體業亟待解決的重大問題。UOML作為全球第一個針對非結構化信息進行處理的操作...
第7章 SybaseIQ的索引 第8章 SybaselQ數據載入和卸載 第9章 SybasecIQcJava套用程式開發 第10章 SybasecIQ性能最佳化 第11章 SybasecIQ集群 第12章 SybasecIQ容災備份解決方案 第13章 非結構化數據 第14章 常見問題及處理 ...
《網際網路大數據處理技術與套用》是2017年出版的圖書,作者是曾劍平。內容簡介 本書內容分為三個部分,第一部分為網際網路大數據的概述;第二部分為網際網路大數據的獲取與存儲,包括了靜態或動態WEB頁面內容獲取技術、結構化或非結構化數據的...
但它必須依託雲計算的分散式處理、分散式資料庫和雲存儲、虛擬化技術。隨著雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。分析師團隊認為,大數據(Big data)通常用來形容一個公司創造的大量非結構化數據和半結構化數據,這些...
面向新型網路套用需求,加快研發新一代搜尋引擎及瀏覽器、智慧型海量數據存儲與管理系統、雲計算平台等網路化關鍵軟體,加快培育新興網路化高端軟體,創新套用與服務模式。加強非結構化數據處理技術和產品的開發及產業化。支持開源軟體開發和套用...
《網際網路處理技術與套用研究》首先對網際網路技術體系進行了系統歸納,闡述了網際網路環境下網際網路聚類分析、的隱私保護、可視化等核心概念及關鍵技術,並對網際網路靜態或動態WEB頁面內容獲取技術、結構化或非結構化數據的存儲、常見的開源系統、...
本書以“數據—知識—服務”為主線,以數據處理、分析和服務的代表性方法與技術為重點。數據處理篇介紹結構化、非結構化和半結構化數據的存儲、查詢和最佳化方法;數據分析篇介紹數據挖掘、知識發現和數據倉庫的經典算法;數據服務篇介紹Web...
3.3.2網路防範技術102 本章小結103 習題103第4章數據處理技術107 4.1數據處理概述107 4.1.1數據採集107 4.1.2結構化與非結構化數據108 4.1.3結構化與非結構化數據的存儲108 4.1.4結構化數據與非結構化數據的區別109 4.2...
作業系統和數據的表示與存儲等;第2部分(第4~6章)為數據處理,介紹不同類型的數據處理過程和Python程式設計基礎,包括對結構化數據和非結構化數據的處理示例;第3部分(第7、8章)為網路新技術及信息安全,介紹網路新技術及套用和...