基本介紹
- 中文名:數據學
- 外文名:Dataology
- 適用領域:數據處理與數據套用
- 所屬學科:數據科學與數據學(Datalogy)
數據科學是利用科學方法、流程、算法和系統從數據中提取價值的跨學科領域。數據科學家綜合利用一系列技能(包括統計學、計算機科學和業務知識)來分析從網路、智慧型手機、客戶、感測器和其他來源收集的數據。數據科學揭示趨勢並產生見解,企業...
《數據學》是2009年復旦大學出版社出版的圖書,作者是朱揚勇。內容簡介 《數據學》包括:數據大爆炸、數據自然界、數據學基礎:介紹了數據學的主要方法,包括:數據勘探、數據獲取與整合、數據挖掘、數據實驗;還介紹了數據學的套用和數據...
數據科學是中國普通高等學校本科專業,於2022年被列入普通高等學校本科專業目錄的新專業名單。發展歷程 教育部公布了2022年度普通高等學校本科專業備案和審批結果,新增了數據科學等21種新專業,並正式納入《普通高等學校本科專業目錄》,將列入...
數據科學知識體系,是數據科學的一個知識體系。數據科學主要以統計學、機器學習、數據可視化以及(某一)領域知識為理論基礎,其主要研究內容包括數據科學基礎理論、數據預處理、數據計算和數據管理,數據科學的知識體系如圖《數據科學的知識...
數據科學與大數據技術專業是一門普通高等學校本科專業,屬於計算機類專業,基本修業年限為四年,授予理學或工學學士學位。 [3] 該專業培養德、智、體、美、勞全面發展,掌握數據科學的基礎知識、理論及技術,包括面向大數據套用的數學、統...
《數據科學理論與實踐(第2版)》是2019年9月清華大學出版社出版的圖書,作者是朝樂門。內容簡介 重點介紹數據科學中的新理論和代表性實踐,填補數據科學與大數據技術專業的核心教材的空白。主要內容包括:基礎理論(術語定義、研究目的、...
《數據科學》是2016年清華大學出版社出版的圖書,作者是朝樂門。內容簡介 數據科學是一門新興的熱門科學,國外一流大學紛紛設立同名課程,相應的專業、課程及書籍也深受歡迎。本書是國內第一部系統闡述數據科學的重要專著,填補了國內此...
《數據科學統計基礎》是2021年中國人民大學出版社出版的圖書。內容簡介 在數據科學的時代背景下,統計學作為一門學科基礎課和方法論課程,更強調的是統計思想在數據科學中的套用。編寫教材、組織教學都是圍繞著這個核心內容來安排的。我們不...
是哥倫比亞大學的統計學兼職教授,也是數據科學和工程學院教育委員會的創始會員。奧尼爾(Cathy O'Neil),Johnson研究實驗室的高級數據科學家,具有哈佛大學的數學博士學位,是麻省理工學院數學系的博士後,曾經是巴納德學院的教授。
《數據科學》是2018年電子工業出版社出版的圖書,作者是方匡南。內容簡介 本書是一本數據科學的入門書籍。每個知識點儘量從實際的套用案例出發,從數據出發,以問題為導向,在解決問題中學習數據挖掘、機器學習等數據科學相關方法。本書將...
圖23統計學中的數據推斷37 圖24數據統計方法的類型(方法論視角)38 圖25數據統計基本方法38 圖26元分析與基本分析39 圖27GFT預測與美國疾病控制中心數據的對比40 圖28GFT估計與實際數據的誤差(2013年2月)40 圖2...
1.對數據的提取與綜合能力;2.統計分析能力;3.數據洞察與信息挖掘能力;4.開發軟體能力;5.網路編程能力;6.數據的可視化表示能力。數據科學家涉及學科:1.計算機科學:數據獲取、數據解析、數據存放、和數據安全 2.數理統計學:數據...
第3章 數據可視化 40 3.1 matplotlib 40 3.2 條形圖 42 3.3 線圖 45 3.4 散點圖 46 3.5 延伸學習 48 第4章 線性代數 49 4.1 向量 49 4.2 矩陣 53 4.3 延伸學習 56 第5章 統計學 57 5.1 ...
本書的每一節都配有習題,以幫助你實踐所學到的知識。本書適合R數據科學家閱讀。圖書目錄 前言 XV 第 一部分 探索 第 1 章 使用ggplot2進行數據可視化 3 1.1 簡介 3 1.2 第 一步 4 1.2.1 mpg數據框 4 1.2.2...
學習基本的數學和統計學知識以及一些目前由數據科學家和分析師用到的偽代碼。除此之外,你還將掌握機器學習,了解一些有用的統計模型,這些模型能夠幫助你控制和處理很密集的數據集,學會如何創建出能股表達數據意圖的可視化方法。
《現代數據科學(R語言·第2版)》是清華大學出版社2022年3月出版的圖書 ,作者是[美] 班傑明·S.鮑默(Benjamin S. Baumer)、丹尼爾·T.卡普蘭(Daniel T. Kaplan) 和 尼古拉斯·J. 霍頓(Nicholas J. Horton) 。內容簡介 《現代...
《數據法學》是2020年北京大學出版社出版的圖書,作者是何淵。內容簡介 在數據價值被高度重視的當下,不能忽視的是對個人數據權利的保護,如何在發揮數據大效用的同時,既保障數據權利,又重視數據安全,需要以構建數據法律新秩序為己任的...
《數據科學入門》是2016年1月人民郵電出版社出版的圖書,作者是章繼濤。內容簡介 本書共分為7章,總計71個實訓項目,全書以數控技能訓練為主線,以項目教學為核心,重點強調通俗性、實用性、可操作性。主要內容包括:數控銑床(華中數控...
《數據科學的統計學路徑》,是2022年東北財經大學出版社有限責任公司出版的圖書,作者是魏瑾瑞。內容簡介 該書首先從統計學的視角闡述了三個關鍵字:數據、波動與推斷,其中,推斷分兩章展開,一是第三章的歸納法,二是第四章基於統計量...
5.1.3數據清洗算法的標準135 5.1.4數據清洗的過程與模型136 5.2不完整數據清洗136 5.2.1基本方法136 5.2.2基於kNN近鄰缺失數據的填充算法138 5.3異常數據清洗140 5.3.1異常值的檢測141 5.3.2統計學方法141 5.3.3...
統計學家內特·西爾弗(Nate Silver)利用大數據預測2012美國選舉結果。麻省理工學院利用手機定位數據和交通數據建立城市規劃。梅西百貨的實時定價機制。根據需求和庫存的情況,該公司基於SAS的系統對多達7300萬種貨品進行實時調價。醫療行業早...
5.4.8 心理學數據 152 5.5 本章思維導圖 154 第三篇 監督式學習 第6 章 模型選擇與評價 157 6.1 模型選擇與評價步驟 158 6.2 大數據的抽樣方法 159 6.2.1 保留方法抽樣 160 6.2.2 自助抽樣法 162 6.2.3 632自助...