實戰AI大模型

內容簡介

《實戰AI大模型》是一本旨在填補人工智慧（AI）領域（特別是AI大模型）理論與實踐之間鴻溝的實用手冊。書中介紹了AI大模型的基礎知識和關鍵技術，如Transformer、BERT、ALBERT、T5、GPT系列、InstructGPT、ChatGPT、GPT 4、PaLM和視覺模型等，並詳細解釋了這些模型的技術原理、實際套用以及高性能計算（HPC）技術的使用，如並行計算和記憶體最佳化。

同時，《實戰AI大模型》還提供了實踐案例，詳細介紹了如何使用Colossal AI訓練各種模型。無論是人工智慧初學者還是經驗豐富的實踐者，都能從本書學到實用的知識和技能，從而在迅速發展的AI領域中找到適合自己的方向。

圖書目錄

第1章深度學習中的AI大模型

1.1 AI大模型在人工智慧領域的興起

1.1.1 AI大模型的發展與挑戰

1.1.2 AI大模型為何難以訓練

1.2 深度學習框架入門

1.2.1 搭建神經網路

1.2.2 訓練一個文本分類器

第2章分散式系統：AI大模型的誕生之所

2.1 深度學習與分散式系統

2.1.1 從分散式計算到分散式AI系統

2.1.2 大規模分散式訓練平台的關鍵技術

2.1.3 Colossal AI套用實踐

2.2 AI大模型訓練方法

2.2.1 梯度累積和梯度裁剪

2.2.2 大批量最佳化器LARSLAMB

2.2.3 模型精度與混合精度訓練

2.3 異構訓練

2.3.1 異構訓練的基本原理

2.3.2 異構訓練的實現策略

2.4 實戰分散式訓練

2.4.1 Colossal AI環境搭建

2.4.2 使用Colossal AI訓練第一個模型

2.4.3 AI大模型的異構訓練

第3章分散式訓練：上千台機器如何共同起舞

3.1 並行策略基礎原理

3.1.1 數據並行:最基本的並行訓練範式

3.1.2 張量並行:層內模型並行

3.1.3 流水線並行的原理與實現

3.2 高級並行策略基礎原理

3.2.1 序列並行:超長序列模型訓練

3.2.2 混合併行:擴展模型到千億參數

3.2.3 自動並行:自動化的分散式並行訓練

3.3 實戰分散式訓練

3.3.1 套用模型並行策略的實際案例

3.3.2 結合多種並行策略的訓練實踐

第4章 AI大模型時代的奠基石Transformer模型

4.1 自然語言處理基礎

4.1.1 自然語言任務介紹

實戰AI大模型

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條