大數據與人工智慧導論(2019年人民郵電出版社出版的圖書)

大數據與人工智慧導論(2019年人民郵電出版社出版的圖書)

本詞條是多義詞,共3個義項
更多義項 ▼ 收起列表 ▲

《大數據與人工智慧導論》是2019年9月人民郵電出版社出版的圖書,作者是姚海鵬、王露瑤、劉韻潔。

基本介紹

  • 中文名:大數據與人工智慧導論
  • 作者:姚海鵬、王露瑤、劉韻潔
  • 出版社:人民郵電出版社
  • 出版時間:2019年9月
  • 頁數:180 頁
  • 定價:79 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787115466020
內容簡介,圖書目錄,

內容簡介

本書主要涉及數據工程、人工智慧算法原理,大數據平台技術、人工智慧算法在大數據平台上的實現、人工智慧算法的套用於實踐。
第 1章是大數據與人工智慧的歷史、套用。第 2章是數據工程。第三章是人工智慧基礎算法的原理介紹。第四章是大數據平台的介紹。第五章以第三章中的幾種算法為例子,介紹了它們是如何在大數據平台上分散式實現的。第六章是當前熱門的深度學習技術的介紹。第七章是實踐。
本書針對1.對大數據和人工智慧感興趣、希望快速了解和入門本領域知識的在讀本科生、研究生。2.希望從事大數據和人工智慧崗位、需要快速提升理論基礎和實戰技能的求職者。3.計算機和網際網路領域,對人工智算法感興趣或工作中迫切需要一定本領域知識的工程師。

圖書目錄

1
第 一章 緒論 10
1.1日益增長的數據 10
1.1.1大數據基本概念 11
1.1.2大數據發展歷程 11
1.1.3大數據的特徵 12
1.1.4大數據的基本認識 13
1.2人工智慧 14
1.2.1認識人工智慧 14
1.2.2人工智慧的派別與發展歷史 14
1.2.3人工智慧的現狀與套用 14
1.2.3 當人工智慧遇上大數據 15
1.3 大數據與人工智慧的機遇與挑戰 16
1.3.1大數據與人工智慧面臨的難題 16
1.3.2大數據與人工智慧的前景 17
第 二章 數據工程 18
2.1數據的多樣性 18
2.1.1數據格式的多樣性 18
2.1.2數據來源的多樣性 19
2.1.3數據用途的多樣性 20
2.2數據工程的一般流程 21
2.2.1 數據獲取 21
2.2.2 數據存儲 21
2.2.3 數據清洗 21
2.2.4 數據建模 21
2.2.5 數據處理 22
2.3數據的獲取 22
2.3.1數據來源 23
2.3.2數據採集方法 23
2.3.3 大數據採集平台 25
2.4數據的存儲與數據倉庫 25
2.4.1數據存儲 25
2.4.2數據倉庫 26
2.5數據的預處理技術 27
2.5.1 為什麼要進行數據預處理 27
2.5.2 數據清理 28
2.5.3 數據集成 29
2.5.4 數據變換 30
2.5.5 數據規約 30
2.6模型的構建與評估 31
2.6.1模型的構建 31
2.6.2評價指標 31
2.7數據的可視化 33
2.7.1 可視化的發展 34
2.7.2 可視化工具 34
第三章 機器學習算法 41
3-1機器學習緒論 41
3.1.1 機器學習基本概念 41
3.1.2評價標準 43
3.1.3 機器模型的數學基礎 46
3-2決策樹理論 50
3.2.2 決策樹的訓練 53
3.2.3 本節總結 58
3.3 樸素貝葉斯理論 59
3.4線性回歸 63
3.5邏輯斯蒂回歸 66
3.5.1二分類邏輯回歸模型 66
3.5.2 二分類邏輯斯蒂回歸的訓練 68
3.5.3 softmax分類器 71
3.5.4邏輯斯蒂回歸和softmax的套用 72
3.5.5本節總結 72
3.6神經網路 73
3.6.1生物神經元和人工神經元 73
3.6.2感知機 75
3.6.4 Sklearn中的神經網路 80
3.6.5本章小結 81
3.6.6 拓展閱讀 81
3.7.1 間隔 82
3.7.2 支持向量機的原始形式 84
3.7.3 支持向量機的對偶形式 86
3.7.4特徵空間的隱式映射:核函式 87
3.7.5 支持向量機拓展 90
3.7.6 支持向量機的套用 90
3.8集成學習 91
3.8.1 基礎概念 91
3.8.2 Boosting 94
3.8.3 Bagging 98
3.8.4 Stacking 99
3.9聚類 100
3.9.1聚類思想 100
3.9.2性能計算和距離計算 100
3.9.3原型聚類:K-means 101
3.9.4密度聚類:DBSCAN 103
3.9.5層次聚類 105
3.9.6 Sklearn中的聚類 105
3.9.7本章小結 106
3.9.8拓展閱讀 106
3.10降維與特徵選擇 106
3.10.1維數爆炸與降維 106
3.10.2降維技術 107
3.10.3特徵選擇算法 109
3.10.4 Sklearn中的降維 112
3.10.5本章小結 112
第四章 大數據框架 113
4-1 Hadoop簡介 113
4.1.1 Hadoop的由來 113
4.1.2 MapReduce和HDFS 114
4-2 Hadoop大數據處理框架 115
4.2.1 HDFS組件與運行機制 116
4.2.2 MapReduce組件與運行機制 120
4.2.3 Yarn框架和運行機制 122
4.2.4 Hadoop相關技術 123
4-3 Hadoop安裝與部署 124
4.3.1 安裝配置單機版Hadoop 124
4.3.2 單機版WordCount程式 128
4.3.3 安裝配置偽分散式Hadoop 129
4-4 MapReduce編程 135
4.4.1 MapReduce綜述 136
4.4.2 Map階段 136
4.4.3 shuffle階段 137
4.4.4 Reduce階段 138
4-5 HBase、Hive和Pig和簡介 138
4.5.1 HBase簡介 139
4.5.2 Hive簡介 139
4.5.3 Pig簡介 141
4-6 Spark簡介 141
4.6.1 spark概述 141
4.6.2 Spark基本概念 142
4.6.3 spark生態系統 143
4.6.4 spark組件與運行機制 144
4-7 Spark安裝使用 145
4.7.1 JDK安裝 146
4.7.2 Scala安裝 148
4.7.3 Spark安裝 148
4.7.4 Winutils安裝 148
4.7.5 使用Spark Shell 149
4.7.6 Spark檔案 151
4-8 Spark實例講解 152
第五章 分散式數據挖掘算法 153
5-1 K-Means聚類方法 154
5.1.1 K-Means聚類算法簡介 154
5.1.2 K-Means算法的分散式實現 154
5-2 樸素貝葉斯分類算法 160
5.2.1 樸素貝葉斯分類並行化設計思路 160
5.2.2 樸素貝葉斯分類並行化實現 161
5-3 頻繁項集挖掘算法 166
5.3.1 Apriori頻繁項集挖掘算法簡介 167
5.3.2 Apriori頻繁項集挖掘的並行化實現 167
5-4參考資料 172
第六章 深度學習簡介 173
6-1從神經網路到深度神經網路 173
6.1.1深度學習套用 173
6.1.2 深度神經網路的困難 175
6.2.1卷積神經網路的生物學基礎 176
6.2.2卷積神經網路結構 177
6-3循環神經網路RNN 182
6.3.1循環神經網路簡介 182
6.3.2循環神經網路結構 182
第七章 數據分析實例 185
7-1 基本數據分析 185
7.1.1數據介紹 185
7.1.2數據導入與數據初識 185
7.1.3分類 189
7.1.4 聚類 191
7.1.5回歸 192
7.1.6降維 194
7.2深度學習項目實戰 195
7.2.1 Tensorflow與keras安裝部署 196
7.2.2使用卷積神經網路進行手寫數字識別 198
7.2.3使用LSTM進行文本情感分類 201
附 錄 206
A 矩陣基礎 206
B 梯度下降 209
牛頓法 210
C 拉格朗日對偶性 211
D python 語法知識 213
E Java語法基礎介紹 228

相關詞條

熱門詞條

聯絡我們