數據科學中的並行計算

數據科學中的並行計算

《數據科學中的並行計算》是西安交通大學出版社出版的圖書,作者是[美]諾曼•馬特洛夫

基本介紹

  • ISBN:9787560599588
  • 作者:[美]諾曼•馬特洛夫
  • 出版社:西安交通大學出版社
  • 出版時間:2017年12月12日
  • 頁數:313
  • 定價:72.00
  • 裝幀:平裝
  • 原作品:Parallel Computing for Data Science with Examples in R,C++ and CUDA
  • 叢書:R語言套用系列
內容簡介
數據科學家的並行計算必讀手冊 “……一本完整、易讀的並行計算入門——它適合很多學科的研究人員和學生使用。這是一本‘必備’的參考書……” ——戴維•E•吉爾斯,維多利亞大學 “這本書我會既用來當參考書,又當教材。書中的例子生動,內容也使讀者直接從概念走向可用於工作的代碼。” ——麥可•凱恩,耶魯大學 本書是第一本並行計算領域中,注意力完全集中在並行數據結構、算法、軟體工具及數據科學中具體套用的書。書中的例子不僅有經典的“n 個樣本,p 個變數”的矩陣形式,還有時間序列、網路圖模型,以及各種其他的在數據科學中常見的結構。本書同時也討論了適用於多種硬體、多種程式語言的的軟體包。 特點 關注數據科學中的套用,包括統計學、數據挖掘和機器學習。 討論了數據科學中的常見數據結構,如網路圖模型。 通篇強調了普遍的原理,如避免降低並行程式速度的因素。 覆蓋了主流的計...(展開全部) 數據科學家的並行計算必讀手冊 “……一本完整、易讀的並行計算入門——它適合很多學科的研究人員和學生使用。這是一本‘必備’的參考書……” ——戴維•E•吉爾斯,維多利亞大學 “這本書我會既用來當參考書,又當教材。書中的例子生動,內容也使讀者直接從概念走向可用於工作的代碼。” ——麥可•凱恩,耶魯大學 本書是第一本並行計算領域中,注意力完全集中在並行數據結構、算法、軟體工具及數據科學中具體套用的書。書中的例子不僅有經典的“n 個樣本,p 個變數”的矩陣形式,還有時間序列、網路圖模型,以及各種其他的在數據科學中常見的結構。本書同時也討論了適用於多種硬體、多種程式語言的的軟體包。 特點 關注數據科學中的套用,包括統計學、數據挖掘和機器學習。 討論了數據科學中的常見數據結構,如網路圖模型。 通篇強調了普遍的原理,如避免降低並行程式速度的因素。 覆蓋了主流的計算平台:多核、集群以及圖像處理單元(GPU)。 解釋了 Thrust 包如何降低多核機器和GPU編程的難度,並使得同一份代碼能夠在不同的平台上工作。 在作者網站上提供了樣例代碼。 譯者序 21 世紀的第二個十年,隨著計算能力的巨大提升和移動網際網路的迅猛發展,大數據時代拉開了它的帷幕。大數據時代的顯著特點就是數據量大,對數據處理的速度和時效提出了苛刻的要求。 在傳統的串列計算下,多核的計算機/集群等只有一個核心能夠進行有效的工作,這就造成了計算性能的浪費。並行計算概念的提出,則解決了這個性能浪費的問題。它能夠協調多個核心共同計算,極大地提升了計算速度,從而滿足了大數據時代人們對高速處理數據的需求。 Norman Matloff 教授在加州大學戴維斯分校教授計算機科學,對計算機架構和算法瞭然於心。更值得一提的是,他還是該校統計系的創始人之一,不但教授本科的統計課程,還在統計系碩士和博士的考試委員會擔任多個職務。對於統計理論的熟悉,使得他在使用計算機編程處理統計問題的時候,更加得心應手。該書即是他在並行計算方向上多年經驗的總結。 本書不是一本並行計算的理論教材。該書別出心裁,使用實例手把手地教會讀者掌握並行計算的基本概念和操作。在提綱挈領地介紹了如何在R 中使用並行方法之後,作者帶領我們學習了多執行緒和多進程,以及並行調度等方面的知識和技能。隨後,作者用詳盡的篇幅講述了如何使用R、C++ 和CUDA分別來進行共享記憶體範式編程和訊息傳遞範式編程。本書在講述了當前流行的MapReduce 之後,又詳細講解了如何並行地實現串列計算下所對應的排序、掃描、矩陣乘法等經典算法。在本書的最後,作者講述了如何使用並行計算來進行統計。此外,本書的附錄中對線性代數、R 和C 也做了簡明的介紹,方便不熟悉的讀者迅速入門。 值得一提的是,Matloff 教授的漢語也非常熟練,在本書的翻譯過程中,他也給出了相應的建議和意見。編輯李穎為本書的編輯工作提出了不少中肯的建議和意見,並為本書的順利出版做出了巨大的努力。在這裡對他們一併表示感謝。 本書兩位譯者的協作,跨越了大洋和時差。翻譯的日子中酸甜苦樂,都化作段子互相慰藉。不禁讓人想到,人的命運啊,當然要靠自我奮鬥,但是也要考慮到歷史的行程。時代帶給我們的,永遠值得珍惜。 譯者於北京 2017 年8 月 前言 感謝你對本書感興趣。我很享受寫書的過程,也希望這本書對你非常有用。為達此目的,這裡有幾點事情我希望說清楚。 本書目標: 我很希望這本書能充分體現它標題的含義數據科學中的並行計算。和我所知道的其他並行計算的書籍不同,這本書里你不會碰到任何一個求解偏微分方程或其

相關詞條

熱門詞條

聯絡我們