GPU編程實戰基於Python和CUDA

內容簡介

本書旨在引導讀者基於Python和CUDA的GPU編程開發高性能的應用程式，先後介紹了為什麼要學習GPU編程、搭建GPU編程環境、PyCUDA入門等內容，以及 CUDA 代碼的調試與性能分析、通過Scikit-CUDA 模組使用 CUDA 庫、實現深度神經網路、CUDA 性能最佳化等。

圖書目錄

第 1章為什麼要學習GPU編程 1

1．1 技術要求 2

1．2 並行化與阿姆達爾定律 2

1．2．1 使用阿姆達爾定律 3

1．2．2 Mandelbrot集 5

1．3 對代碼進行性能分析 7

1．4 小結 9

1．5 習題 10

第 2章搭建GPU編程環境 11

2．1 技術要求 12

2．2 確保擁有合適的硬體 12

2．2．1 檢查硬體（Linux系統） 13

2．2．2 檢查硬體（Windows系統） 14

2．3 安裝GPU驅動程式 15

2．3．1 安裝GPU驅動程式（Linux系統） 16

2．3．2 安裝GPU驅動程式（Windows系統） 17

2．4 搭建C++編程環境 18

2．4．1 設定GCC、Eclipse IDE和圖形處理庫（Linux系統） 18

2．4．2 設定Visual Studio（Windows系統） 18

2．4．3 安裝CUDA Toolkit 20

2．5 為GPU編程設定Python環境 21

2．5．1 安裝PyCUDA（Linux系統） 22

2．5．2 創建環境啟動腳本（Windows系統） 22

2．5．3 安裝PyCUDA（Windows系統） 23

2．5．4 測試PyCUDA 23

2．6 小結 24

2．7 習題 25

第3章 PyCUDA入門 26

3．1 技術要求 26

3．2 查詢GPU 27

3．3 使用PyCUDA的gpuarray類 31

3．3．1 使用gpuarray在GPU之間傳輸數據 31

3．3．2 使用gpuarray進行基本的逐元素算術運算 32

3．4 使用PyCUDA的ElementwiseKernel執行逐元素運算 37

3．4．1 重溫Mandelbrot集 40

3．4．2 函式式編程簡介 44

3．4．3 並行化的掃描核心函式和規約核心函式簡介 45

3．5 小結 47

3．6 習題 47

第4章核心函式、執行緒、執行緒塊與格線 49

4．1 技術要求 50

4．2 核心函式 50

GPU編程實戰基於Python和CUDA

基本介紹

內容簡介

圖書目錄

作者簡介

相關詞條

熱門詞條