《數據處理與知識發現》是2018年機械工業出版社出版的圖書,作者是徐琴。
基本介紹
- 中文名:數據處理與知識發現
- 作者:徐琴
- ISBN:9787111605843
- 定價:45元
- 出版社:機械工業出版社
- 出版時間:2018年8月
- 裝幀:平裝
- 開本:16開
《數據處理與知識發現》是2018年機械工業出版社出版的圖書,作者是徐琴。
《數據處理與知識發現》是2018年機械工業出版社出版的圖書,作者是徐琴。內容簡介本書系統地介紹了數據預處理、數據倉庫和數據挖掘的原理、方法及套用技術, 以及採用Mahout 對相應的挖掘算法進行實際練習。本書共有11 章...
雖然數據挖掘是知識發現過程的核心,但它通常僅占KDD的一部分(大約是15% 到25%) 。因此數據挖掘僅僅是整個KDD過程的一個步驟,對於到底有多少步以及哪一步必須包括在KDD過程中沒有確切的定義。然而,通用的過程應該接收原始數據輸入,選擇重要的數據項,縮減、預處理和濃縮數據組,將數據轉換為合適的格式,從數據中...
大多數的研究都集中在知識挖掘算法和套用上。需要說明的是,有的學者認為,數據開採和知識發現含義相同,表示成KDD/DM.它是一個反覆的過程,通常包含多個相互聯繫的步驟:預處理、提出假設、選取算法、提取規則、評價和解釋結果、將模式構成知識,最後是套用。在實際,人們往往不嚴格區分知識挖掘和資料庫中的知識發現,...
空間數據挖掘是指從空間資料庫中抽取沒有清楚表現出來的隱含的知識和空間關係,並發現其中有用的特徵和模式的理論、方法和技術。 空間數據挖掘和知識發現的過程大致可分為以下多個步驟:數據準備、數據選擇、數據預處理、數據縮減或者數據變換、確定數據挖掘目標、確定知識發現算法、數據挖掘、模式解釋、知識評價等,而數據...
科研大數據(Scientific Research Big Data)起源於“大數據”的研究。科研大數據是與科學研究相關,來源於自然過程的感知和實驗數據的獲取,包括科學觀測與監測的數據、實驗數據等一系列用於科學研究的數據。科研大數據是科學大數據的子集,是科學知識發現的“基石”。科研大數據是兼具“技術理性”與“人文價值”的範式...
除了搜尋工具,另外一種常用於知識獲取的工具是數據挖掘技術。數據挖掘,也可以稱為資料庫中的知識發現(Knowledge Discovery in Database,KDD),是從大量數據中提取出可信、新穎、有效並能被人理解的模式的高級處理過程。數據挖掘運用選定的知識發現算法,從數據中提取出用戶所需要的知識,這些知識可以用一種特定的方式...
軍事數據處理是在軍事領域對獲取的戰略信息和數據進行處理的手段,為適應現代戰爭的需要, 增強信息的獲取處理存儲交換能力, 奪取制信息權成為贏得戰爭的關鍵因素, 而建立長期戰略軍事數據處理系統即信息中心對於奪取制信息權起著至關重要的作用。簡介 物質、能量和信息這三大要素在任何時代的戰爭中都是起作用的。從工業...
《基於知識發現的林火模型研究》是依託北京林業大學,由馮仲科擔任項目負責人的面上項目。項目摘要 林火是一種世界性的災難。我國是一個林火多發國家,林火造成的經濟損失居高不下,然而林火研究的現狀卻不盡如人意。知識發現是以數據的獲取為起點,對數據預處理、數據處理和模式發現及模式評價的具有一定程度的智慧型...
收集多平台,多來源的數據源,建立有效的清理與整合機制,在此基礎上構建為數據分析服務的統一的多維度的數據集市,使最終用戶不用熟知算法和一些背景專業知識就可以得到比較專業的分析結果。簡介 數據挖掘和分析是知識發現的一個過程,是在數據處理的過程中不斷發現問題,修正目標和方法,最終得出結論的過程。隨著保險...
國際知識發現和數據挖掘競賽(KDD-CUP)競賽是由ACM 的數據挖掘及知識發現專委會(SIGKDD)主辦的數據挖掘研究領域的國際頂級賽事。其中KDD的英文全稱是Knowledge Discovery and Data Mining,即知識發現與數據挖掘。KDD Cup比賽由ACM協會的SIGKDD分會舉辦,從1997年開始,每年舉辦一次,是數據挖掘領域最有影響力的賽事...
粒計算是當前人工智慧,特別是數據挖掘和知識發現領域一個非常活躍的研究方向,它以粒為基本計算單位,以處理大規模複雜數據和信息等建立有效的計算模型為目標。粒計算的基本思想是從多角度、多層次進行信息粒度的表示和問題求解,在複雜和海量數據處理方面有著獨特的優勢。本課題從模擬人的認知出發,以複雜信息系統和...
因此,從工程化的角度理解數據科學,數據工程既包括數據處理技術,也包括數據分析技術和數據服務技術;既包括查詢處理和最佳化、事務和工作流管理和資料庫架構等基礎內容,也包括數據挖掘與知識發現、時空數據、元數據和社會數據分析等經典問題,另外還包括機率數據、雲計算和大數據管理等前沿課題。一方面,技術發展迅速、涉及...
數據分析與挖掘技術是機器學習算法和數據存取技術的結合,利用機器學習提供的統計分析、知識發現等手段分析海量數據,同時利用數據存取機制實現數據的高效讀寫。機器學習在數據分析與挖掘領域中擁有無可取代的地位,2012年Hadoop進軍機器學習領域就是一個很好的例子。模式識別 模式識別起源於工程領域,而機器學習起源於計算機...
雖然有很多方式可以降低數據中心的能耗,減少搜尋所需時間則是他們的關注重點。通過提高搜尋速度,伺服器在等量工作中消耗的能源就會減少。研究小組使用雙賽靈思現場可程式邏輯門陣列(Xilinx FPGAs),執行信息檢索和數據庫文檔過濾算法。結果發現,FPGA系統的搜尋速度比英特爾安騰-2雙核處理器要快20倍。不僅如此,FPGA晶片...