ChatGPT原理與實戰：大型語言模型的算法、技術和私有化

內容簡介

這是一本系統梳理並深入解析ChatGPT核心技術、算法實現、工作原理、訓練方法的著作，也是一本能指導你搭建專屬ChatGPT和實現大模型遷移及私有化的著作。本書得到了MOSS系統負責人邱錫鵬等多位專家的高度評價和鼎力推薦。

具體地，通過本書你能了解或掌握以下知識：

ChatGPT的工作流程和技術棧

ChatGPT的工作原理和算法實現

基於Transformer架構的一系列預訓練語言模型的原理

強化學習的基礎知識

提示學習與大模型湧現出的上下文學習、思維鏈

大模型的訓練方法及常見的分散式訓練框架

基於人工反饋的強化學習整體框架

從零搭建類ChatGPT模型，模擬完整的ChatGPT訓練過程

本書集理論、實戰和產業套用於一體，提供大量經詳細注釋的代碼，方便讀者理解和實操。總之，不管里是想深入研究ChatGPT本身，還是正在研發或使用其他大模型，本書都應該能給你頗具價值的技術啟發與思考，讓你在大模型的路上快速前行，少走彎路。

圖書目錄

讚譽

前言

第1章　了解ChatGPT1

1.1　ChatGPT的由來1

1.1.1　什麼是ChatGPT2

1.1.2　ChatGPT的發展歷史2

1.2　ChatGPT的工作流程3

1.3　ChatGPT用例3

1.3.1　日常任務4

1.3.2　編寫代碼5

1.3.3　文本生成6

1.3.4　辦公自動化9

1.4　本章小結10

第2章　ChatGPT原理解構11

2.1　背景知識11

2.1.1　自然語言處理的發展歷程12

2.1.2　大型語言模型的發展歷程14

2.2　ChatGPT同類產品18

2.2.1　BlenderBot 3.018

2.2.2　LaMDA20

2.2.3　Sparrow23

2.3　ChatGPT的工作原理25

2.3.1　預訓練與提示學習階段26

2.3.2　結果評價與獎勵建模階段28

2.3.3　強化學習與自我進化階段28

2.4　算法細節29

2.4.1　標註數據29

2.4.2　建模思路30

2.4.3　存在的問題30

2.5　關於ChatGPT的思考31

2.6　本章小結32

第3章　預訓練語言模型33

3.1　Transformer結構33

3.2　基於Encoder結構的模型36

ChatGPT原理與實戰：大型語言模型的算法、技術和私有化

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條