東京大學資料科學家養成全書

內容簡介

「大數據會消失，數據科學不會」

「所有的科學都是數據科學」

―――信息科學時代最需要閱讀的一本書―――

東京大學資料科學人氣講座全收錄────

★傳說中的東大松尾研究室超熱門課程，第一手內容完整公開！

★用Python學習基本的程式撰寫，邊做邊學，鍛鍊最強的資料科學技能！

★收錄大量練習題和綜合題演練，打好理論基本功，具體套用於實務現場！

★體驗數據科學的魅力，培養整合跨領域課題的創造力！

所謂科學，是從世界上混沌的現象里找出本質，逐步解決各式各樣的問題。在日漸龐大的各種數據當中，運用科學的力量解決各種問題，便可說是資料科學。

資料科學不僅只是數學（統計、機率、機器學習等），更是借用IT等各種力量，不斷挑戰世界上的難題與背後課題的綜合領域。

運用這樣數據科學和人工智慧的力量，減少浪費與沒有效率的事物，進一步創造出新價值，可以讓這個世界更加美好。

█ 動手操作實際的數據，大量練習題馬上學、馬上練、馬上懂！

本書廣泛說明資料科學不可不知的基礎事項，搜羅豐富的重要關鍵知識和好用的參考數據，成為學習數據科學的地圖與羅盤。

書中主要使用Python來學習基本的程式撰寫技巧，以及數據的取得、讀取、操作等，含括各式各樣Python函式庫的使用方式、機率統計的手法、機器學習（監督式學習、非監督式學習、性能調校），還有讓Python高速化的方法和Spark的簡單操作等。

書中說明如何實際將現場的數據進行加工與分析，如何具體運用於市場行銷或金融等，使用何種手法來撰寫程式比較好，以及組合程式的技巧和流程。除了理論解說，也介紹實務性的使用方法，可立即上手套用。

收錄各種類型的實作練習題和綜合問題，以實際的問題為前提來思考，一邊動手實踐。

█ 本書的出版緣由

本書以2017年至2018年於東京大學舉辦的「全球消費智慧捐贈講座」講義和線上課程教材為基礎，用簡潔易懂的形式匯整編纂而成。

這個廣受歡迎的熱門講座首度出版，原因有三：

首先，希望讓更多讀者了解數據科學，培養數據分析技能。資訊時代各行各業都需要數據分析的人才，了解應該具備哪些知識、有何種處理手法、能達成什麼樣的目標，善用數據科學將是致勝的關鍵。

其次，雖然線上資源豐富又方便取得，但並非隨時都能在線上學習。藉由書籍的形式，可因地制宜反覆演練複習。

第三，以學習效果來說，書本的編排有助於深入思考，成效更佳。

█ 本書的目標讀者

▌有程式設計經驗、完成理科大一大二程度數學，以及對於學習數據科學有高度意願的一般人士

▌藉由本書，可掌握資料科學入門程度至中級程度的內容，已達中級程度以上者也能參酌本書來複習數據分析相關知識