大規模語言模型開發基礎與實踐

大規模語言模型開發基礎與實踐

《大規模語言模型開發基礎與實踐》是由王振麗著,北京大學出版社於2024年8月出版的圖書。

基本介紹

  • 中文名:大規模語言模型開發基礎與實踐
  • 作者:王振麗
  • 出版時間:2024年8月1日
  • 出版社:北京大學出版社
  • ISBN:9787301352595
  • 裝幀:平裝
內容簡介,圖書目錄,作者簡介,

內容簡介

本書循序漸進、詳細講解了大模型開發技術的核心知識,並通過具體實例的實現過程演練了使用TensorFlow和PyTorch開發大模型程式的方法和流程。
全書共12章,分別講解了大模型基礎,數據集的載入、基本處理和製作,數據集的預處理,卷積神經網路模型,循環神經網路模型,特徵提取,注意力機制,模型訓練與調優,模型推理和評估,大模型最佳化算法和技術,AI智慧型問答系統和AI人臉識別系統。全書簡潔而不失其技術深度,內容豐富全面。本書易於閱讀,以極簡的文字介紹了複雜的案例,是學習大模型開發的實用教程。
本書適用於已經了解Python基礎開發的讀者,以及想進一步學習大模型開發、模型最佳化、模型套用和模型架構的讀者,還可以作為大專院校相關專業的師生用書和培訓學校的專業性教材。

圖書目錄

第1章 大模型基礎
1.1人工智慧
1.2機器學習和深度學習
1.3大模型簡介
1.4大模型開發與套用的技術棧
第2章 數據集的載入、基本處理和製作
2.1數據集的載入
2.2數據集的基本處理
2.3數據集的製作
第3章 數據集的預處理
3.1數據清洗和處理
3.2數據轉換與整合
3.3數據標準化與歸一化
3.4數據增強技術
第4章 卷積神經網路模型
4.1卷積神經網路簡介
4.2卷積神經網路模型開發實戰
第5章 循環神經網路模型
5.1文本處理與循環神經網路簡介
5.2循環神經網路模型開發實戰
第6章 特徵提取
6.1特徵提取簡介
6.2特徵的類型和重要性
6.3特徵選擇
6.4特徵抽取
6.5文本數據的特徵提取
6.6 圖像數據的特徵提取
第7章 注意力機制
7.1注意力機制基礎
7.2TensorFlow 機器翻譯系統
7.3 PyTorch 機器翻譯系統
第8章 模型訓練與調優
8.1模型訓練最佳化
8.2損失函式和最佳化算法
8.3批量訓練和隨機訓練
8.4模型驗證和調優
第9章 模型推理和評估
9.1模型推理
9.2模型評估
第10章 大模型最佳化算法和技術
10.1常見的大模型最佳化算法和技術
10.2梯度下降法
10.3模型並行和數據並行
10.4學習率調度
10.5權重初始化策略
10.6遷移學習
10.7其他大模型最佳化算法和技術
第11章 AI智慧型問答系統(TensorFlow+TensorFlow. js+SQuAD 2.0+Mobile-BERT)
11.1背景簡介
11.2問答系統的發展趨勢:AI 問答系統
11.3技術架構
11.4具體實現
11.5調試運行
第12章 AI人臉識別系統(PyTorch+OpenCV+Scikit-Image+MobileNet+ArcFace)
12.1 系統簡介
12.2系統需求分析
12.3數據集
12.4訓練模型
12.5評估模型
12.6人臉識別

作者簡介

王振麗,華中科技大學計算機碩士,精通C、C#、C++、Java、Python等多門程式語言。現任騰訊AI產品架構師,主要從事移動端底層系統架構、驅動程式、AI套用的研究和開發工作,對人工智慧的架構設計和實現原理有非常深刻的認識和理解。精通各種多模態預訓練算法,熟悉Prompt Engineering和模型Tuning方法,在協同大模型垂直領域的訓練和調優方面經驗豐富,在提升大模型業務的產品落地領域有著豐富的見解。
check!

熱門詞條

聯絡我們