數據科學與工程算法基礎

《數據科學與工程算法基礎》是2021年高等教育出版社出版的圖書。

基本介紹

  • 中文名:數據科學與工程算法基礎
  • 出版時間:2021年5月1日
  • 出版社:高等教育出版社
  • ISBN:9787040553369
內容簡介,圖書目錄,

內容簡介

《數據科學與工程算法基礎》從機率統計、線性代數和組合最佳化角度出發,介紹經典的數據科學與工程算法,內容涉及數據分析處理全流程的算法及其數學基礎,主要包括抽樣算法;尾機率不等式及其套用;典型的哈希技術,如布隆過濾器和局部敏感哈希;數據流模型以及典型Misra Gries算法、Count Sketch算法;隨機遊走及其套用;EM算法;特徵值計算;奇異值分解和主成分分析;矩陣分解;整數規劃;子模函式及其套用;模組度及社區發現等。全書配有大量翔實的套用實例可供參考,有相當數量的習題可供讀者練習。
  《數據科學與工程算法基礎》可作為數據科學與大數據技術專業本科生、研究生相關課程的教材或參考書,也可供相關領域技術人員參考。

圖書目錄

第1章 緒論
1.1 數據分析處理階段
1.1.1 數據採集
1.1.2 數據預處理
1.1.3 數據存儲與管理
1.1.4 數據分析與挖掘
1.1.5 數據可視化
1.2 算法設計原則
1.2.1 數據特點
1.2.2 算法評價
1.2.3 算法設計原則
本章小結
習題1
第2章 抽樣算法
2.1 引入
2.2 基本概念
2.2.1 總體與樣本
2.2.2 抽樣調查
2.3 系統抽樣
2.3.1 直線等距抽樣
2.3.2 圓形等距抽樣
2.3.3 系統抽樣特點
2.4 分層抽樣
2.5 水庫抽樣
2.5.1 水庫抽樣算法
2.5.2 算法分析
2.5.3 分散式水庫抽樣算法
本章小結
習題2
第3章 尾機率不等式及其套用
3.1 引入
3.2 Markov不等式
3.3 Chebyshev不等式
3.4 Chernoff不等式
3.5 尾機率不等式的套用-Morris算法
3.5.1 Morris算法
3.5.2 Morris+算法
3.5.3 Morris++算法
本章小結
習題3
第4章 哈希技術
4.1 引入
4.2 哈希
4.3 布隆過濾器
4.3.1 布隆過濾器的基本原理
4.3.2 誤判率
4.3.3 降低誤判率
4.3.4 套用場景
4.4 局部敏感哈希
4.4.1 哈希函式的選擇
4.4.2 Shingling
4.4.3 Min-Hashing
4.4.4 基於Min-Hashing的局部敏感哈希過程
4.4.5 套用場景
本章小結
習題4
第5章 數據流模型及頻繁項挖掘
5.1 引入
5.2 數據流模型
5.2.1 數據流和數據流模型
5.2.2 數據流子模型
5.2.3 概要數據結構
5.2.4 近似算法
5.3 頻繁項挖掘
5.4 確定性近似頻數算法Misra Gries
5.4.1 Misra Gries算法
5.4.2 Misra Gries算法分析
5.5 隨機近似頻數算法Count Sketch
5.5.1 簡單抽樣算法
5.5.2 Basic Count Sketch算法
5.5.3 Count Sketch算法
5.5.4 Count-Min Sketch
算法
本章小結
習題5
第6章 EM算法
6.1 引入
6.2 最大似然估計方法
6.2.1 似然函式
6.2.2 最大似然估計
6.2.3 混合模型
6.3 EM算法
6.3.1 算法推導
6.3.2 EM算法
6.3.3 EM算法的收斂性
本章小結
習題6
第7章 隨機遊走及其套用
7.1 引入
7.2 隨機過程
7.2.1 馬爾可夫過程
7.2.2 隨機遊走
7.2.3 轉移機率矩陣
……
第8章 特徵值計算
第9章 奇異值分解與主成分分析
第10章 矩陣分解
第11章 整數規劃
第12章 子模函式及其套用
第13章 模組度及社區發現
參考文獻

相關詞條

熱門詞條

聯絡我們