數據科學概論(2021年03月中國人民大學出版社出版的圖書)

數據科學概論(2021年03月中國人民大學出版社出版的圖書)

本詞條是多義詞,共2個義項
更多義項 ▼ 收起列表 ▲

《數據科學概論》是中國人民大學出版社出版的圖書。

基本介紹

  • 中文名:數據科學概論
  • 作者:李揚、李艦
  • 出版時間:2021年3月1日
  • 出版社:中國人民大學出版社
  • 頁數:264 頁
  • ISBN:9787300290607
  • 開本:16 開
  • 裝幀:平裝
內容簡介,目錄,

內容簡介

作為問題導向、數據驅動的交叉學科,數據科學要求研究者具備紮實的知識儲備、高效的編程能力以及廣闊的研究視野。本書嘗試以概論的形式對數據科學的緣起、內涵、技術、工具、原則、方法、平台、產品、套用等展開討論,幫助讀者建立完整的知識體系與專業邏輯。全書劃分為四個部分:第一部分是緒論,鳥瞰數據科學的概念、歷史與套用;第二部分是基礎技能,涵蓋編程工具、數學基礎與統計原則;第三部分是分析方法,遵從從探索性到驗證性的數據分析思路,闡釋數據可視化方法,講解面向結構化數據的機器學習與人工智慧模型,並討論非結構化數據的分析技術;第四部分是數據套用,從業界視角介紹資料庫、大數據平台、可重複研究的理念與實踐,並以網際網路、零售、金融、醫療健康四個行業為例展開實戰討論。

目錄

第1章 緒論
1.1數據科學的概念
1.1.1數據科學的研究對象
1.1.2常見的數據科學方法
1.2數據科學的發展變遷
1.2.1數據科學的前身:統計學
1.2.2當代統計學:數據科學
1.3數據科學的套用領域
1.3.1網際網路行業
1.3.2零售行業
1.3.3金融行業
1.3.4醫療健康行業
第2章 數據科學的編程工具
2.1 R簡介
2.1.1安裝和設定
2.1.2基礎操作
2.1.3數據結構
2.1.4基礎語法
2.2 Python和數據科學
2.2.1安裝和使用
2.2.2數據結構
2.2.3基礎語法
2.3 Julia簡介
2.3.1安裝和使用
2.3.2編程基礎
第3章 數據科學的數學基礎
3.1線性代數
3.1.1向量基礎
3.1.2矩陣運算
3.2機率論和數理統計
3.2.1隨機變數和分布
3.2.2數理統計簡介
3.3最最佳化方法
3.3.1非線性規劃
3.3.2線性規劃
第4章 數據科學的統計原則
4.1可重複原則
4.1.1數據的擾動
4.1.2模型的擾動
4.2可預測原則
4.2.1可預測性
4.2.2交叉驗證
4.3可計算原則
4.3.1大數據時代的數據特徵
4.3.2大規模數據的處理方法
4.3.3高維 /超高維數據的處理方法
第5章 數據可視化
5.1基礎統計圖形
5.1.1圖形設備
5.1.2基礎作圖
5.1.3 ggplot繪圖語言
5.2可視化與數據分析
5.2.1單變數的分布
5.2.2兩變數的關係
5.2.3多變數的關係
5.3現代數據可視化方法
5.3.1動態統計圖形
5.3.2互動式工具
第6章 數據挖掘和機器學習
6.1從海量數據到大數據
6.1.1海量數據與數據挖掘
6.1.2大數據與機器學習
6.2無監督學習
6.2.1主成分分析
6.2.2聚類分析
6.3有監督學習
6.3.1回歸分析
6.3.2分類問題和分類性能評估
6.3.3常用分類模型
第7章 人工智慧
7.1人工智慧簡史
7.1.1人工智慧的發展歷史
7.1.2從神經網路到深度學習
7.2神經網路簡介
7.2.1神經網路模型
7.2.2感知機的學習
7.2.3 BP算法
7.3深度學習基礎
7.3.1常見深度學習框架
7.3.2 MXNet簡介
7.3.3深度學習實戰
第8章 非結構化數據分析
8.1圖像分析
8.1.1圖像處理基礎
8.1.2卷積神經網路
8.1.3圖像分類示例
8.2文本分析
8.2.1文本數據的處理
8.2.2文本分類示例
8.2.3句法分析
8.3音頻分析
8.3.1音頻數據的處理
8.3.2音頻特徵的提取
第9章 資料庫和數據倉庫
9.1數據結構簡介
9.1.1數據的測量尺度
9.1.2數據的基礎類型
9.1.3數據的邏輯結構
9.2資料庫和 SQL
9.2.1資料庫基礎介紹
9.2.2常見的資料庫產品
9.2.3 SQL語句簡介
9.3數據倉庫和商業智慧型
9.3.1數據倉庫基礎介紹
9.3.2數據倉庫的多維模型
9.3.3 BI分析簡介
第10章 大數據平台
10.1大數據和雲計算
10.1.1大數據技術的發展變遷
10.1.2雲計算簡介
10.2並行計算框架
10.2.1並行計算簡介
10.2.2共享記憶體和 GPU計算
10.2.3 MPI並行
10.3分散式存儲與 Hadoop
10.3.1容器和 Docker
10.3.2 Hadoop和 MapReduce
10.3.3 Spark簡介
第11章 可重複研究與產品化
11.1分析報告與數據產品簡介
11.1.1自動化報告的常見框架
11.1.2數據產品簡介
11.2可重複研究
11.2.1 knitr的套用
11.2.2 Jupyter的套用
11.3數據產品的設計與開發
11.3.1 Shiny基礎
11.3.2動態互動的數據產品
第12章 數據科學的行業套用
12.1網際網路行業
12.1.1網際網路行業的數據
12.1.2網際網路行業的數據科學套用
12.1.3分析示例
12.2零售行業
12.2.1零售行業的數據
12.2.2零售行業的數據科學套用
12.2.3分析示例
12.3金融行業
12.3.1金融行業的數據
12.3.2金融行業的數據科學套用
12.3.3分析示例
12.4醫療健康行業
12.4.1醫療健康行業的數據
12.4.2醫療健康行業的數據科學套用
12.4.3分析示例

相關詞條

熱門詞條

聯絡我們