一本書讀懂AIGC:ChatGPT,AI繪畫、智慧型文明與生產力變革

一本書讀懂AIGC:ChatGPT,AI繪畫、智慧型文明與生產力變革

《一本書讀懂AIGC:ChatGPT,AI繪畫、智慧型文明與生產力變革》是電子工業出版社出版的圖書,作者是a15a。

基本介紹

  • 中文名:一本書讀懂AIGC:ChatGPT,AI繪畫、智慧型文明與生產力變革 
  • 作者:a15a
  • 出版時間:2023年3月
  • 出版社:電子工業出版社
  • 頁數:252 頁
  • 字數:233千字
  • ISBN:9787121353932
  • 開本:16 開
內容簡介,圖書目錄,

內容簡介

本書以通俗易懂的方式從各個層面介紹了AIGC的基礎知識,並輔以大量案例引領讀者了解AIGC的套用實踐,讓讀者可以更快速地利用AIGC改善工作和生活。 第1章從AI發展歷史到資本市場近況闡述了AIGC產業的概況,第2章介紹了AIGC相關技術,第3章介紹了文本類AIGC技術的發展及其在傳媒、教育、辦公等場景中的套用,第4章介紹了聲音類AIGC技術的發展及其在音樂、仿真等領域中的套用,第5章介紹了圖片類AIGC的發展及其在圖片生成、圖片處理、圖片識別等領域中的套用,第6章介紹了視頻類AIGC的發展及其在視頻生成、數字人等領域中的套用,第7章介紹了AIGC上下游產業鏈(包括晶片、VR等相關設備、元宇宙建模)的概況,第8章提出了AIGC對人類文明發展產生的影響,並對普通人如何應對AIGC帶來的“生產力爆炸”提出方法論。

圖書目錄

第1章 我們為什麼要關注AIGC
1.1 從人工智慧到人工智慧生成內容
1.2 巨頭如是說
1.2.1 國外“大廠”在AIGC領域的布局
1.2.2 國內“大廠”在AIGC領域的布局
1.3 資本狂潮
1.4 異軍突起的獨角獸企業
1.4.1 OpenAI
1.4.2 Stability AI
1.4.3 Scale AI
1.5 行業“大牛”:誰是下一個“賈伯斯”
第2章 AIGC相關技術介紹
2.1 規則系統
2.2 變分自編碼器
2.3 生成對抗網路
2.3.1 GAN模型訓練原理
2.3.2 CGAN模型
2.3.3 基於模型架構的衍生
2.3.4 基於損失函式的衍生
2.3.5 圖像生成領域的衍生
2.4 Transformer模型架構
2.5 基於Transformer模型架構的LLM
2.5.1 基於編碼器的LLM
2.5.2 基於解碼器的LLM
2.5.3 基於編碼器和解碼器的LLM
2.5.4 BERT模型與GPT模型對比
2.6 擴散模型
2.6.1 擴散模型原理
2.6.2 DALL?E 2模型
2.6.3 Stable Diffusion模型
2.7 其他模型
2.8 LLM的前景光明
第3章 下筆如有神:文本類AIGC
3.1 何為“智慧型”
3.2 拆解文本生成技術原理
3.2.1 1950—1970年,NLP初露鋒芒
3.2.2 1980—2010年,NLP的寒冬與機遇並存
3.2.3 2010—2019年,技術迸發與沉澱
3.2.4 2019年至今,AIGC進入尋常百姓家
3.3 文本類AIGC在傳媒場景中的套用
3.3.1 社交媒體文案:Jasper
3.3.2 新聞寫作:Quakebot、CNET
3.3.3 劇本撰寫:海馬輕帆
3.4 文本類AIGC在教育場景中的套用
3.4.1 文章撰寫:EssayGenuis
3.4.2 出題和做題:高校聯合團隊開發的AI程式
3.4.3 青少年教育:Cognii
3.5 文本類AIGC在辦公場景中的套用
3.5.1 搜尋引擎最佳化:Kafkai
3.5.2 行銷文案:Copysmith
3.5.3 電子郵件:Compose.ai
3.5.4 代碼撰寫:GitHub Copilot
3.6 文本類AIGC的其他熱門場景
3.6.1 AI聊天機器人
3.6.2 AIGC搜尋引擎:Perplexity AI
3.7 萬眾矚目的ChatGPT
3.7.1 ChatGPT是什麼
3.7.2 ChatGPT的海量套用場景
3.7.3 GPT-4模型:截至2023年3月最強的AI模型
3.7.4 ChatGPT對普通人意味著什麼
3.8 文本類AIGC的未來
第4章 “聲臨其境”:聲音類AIGC
4.1 從讓機器開口說話開始
4.1.1 18至19世紀的嘗試
4.1.2 20世紀30年代,語音合成技術的萌芽
4.1.3 20世紀50年代,計算機語音合成系統的起源
4.1.4 20世紀末,傳統的語音合成方法
4.1.5 2016年,AIGC打破語音合成技術的發展瓶頸
4.1.6 2017年,語音合成技術迎來研究熱
4.2 音樂類AIGC
4.2.1 從留聲機到個人計算機製作的電子音樂
4.2.2 早期的音樂類AIGC
4.2.3 端到端模型大展身手
4.2.4 歌聲合成
4.2.5 音頻延續
4.3 人聲類AIGC
4.3.1 變聲器
4.3.2 語音助手
4.3.3 有聲內容創作
4.3.4 智慧型電話機器人
4.3.5 教育
4.3.6 無障礙溝通
4.4 聲音類AIGC的未來
4.4.1 業內觀點
4.4.2 聲音類AIGC的局限性和未來展望
第5章 如你所見:圖片類AIGC
5.1 從計算機藝術到算法模型藝術
5.1.1 20世紀70年代,藝術家的午夜花園
5.1.2 2012年,一次有突破意義的嘗試:貓臉的識別與生成
5.1.3 2014年,GAN模型問世
5.1.4 2017年,夢始於Transformer模型
5.1.5 2021年,文本與圖片進行匹配:CLIP模型和文字提示詞
5.1.6 2020—2022年,圖片生成技術開啟AI繪畫元年:擴散模型
5.2 AI繪畫
5.2.1 主流的AI繪畫工具介紹
5.2.2 生成圖片類AIGC的方式
5.2.3 Prompt詞組
5.3 圖片處理
5.3.1 AI修圖
5.3.2 圖片增強
5.3.3 分割摳圖
5.4 圖片類AIGC的衍生套用:AI識圖和AI鑒圖
5.4.1 人臉和人體識別
5.4.2 通用圖片識別
5.4.3 是否由AI繪畫工具創作
5.5 實用、有趣的圖片世界
5.5.1 頭像生成
5.5.2 模擬場景
5.5.3 PPT生成
5.5.4 設計
5.5.5 稿件配圖
5.5.6 更多場景
5.6 圖片類AIGC的未來
5.6.1 局限性和發展預測
5.6.2 怎么看AI藝術
5.6.3 筆者的一些淺見
第6章 眾所周知,視頻是不能PS的:視頻類AIGC
6.1 視頻生成技術的發展歷程
6.1.1 早期探索
6.1.2 2014—2016年,視頻生成起步:無條件視頻生成
6.1.3 2017年,潘多拉的魔盒:人像視頻生成
6.1.4 2018—2019年,視頻生成視頻技術的突破
6.1.5 2021年,文本生成視頻技術的發展
6.1.6 2022年,擴散模型進軍視頻生成領域
6.2 視頻生成工具
6.2.1 數字人視頻生成工具
6.2.2 視頻編輯工具
6.2.3 文本生成視頻工具
6.3 視頻生成套用
6.3.1 高清內容生成
6.3.2 快速拆條和視頻摘要生成
6.3.3 場景植入
6.3.4 視頻卡通化
6.3.5 文本生成視頻
6.3.6 數字人視頻生成
6.3.7 人臉視頻生成
6.4 數字人:仿生人與電子羊
6.5 視頻類AIGC的未來
6.5.1 局限性
6.5.2 未來預測
第7章 AIGC的相關產業和生態發展
7.1 晶片:算力決定智力
7.1.1 在AIGC領域中,現在用什麼晶片
7.1.2 隨著AIGC的發展,對晶片會有什麼新的需求
7.2 AIGC展示連線埠:AR/VR/MR/XR設備
7.2.1 AR設備
7.2.2 VR設備
7.3 模型類AIGC套用在元宇宙里自動化建模
7.3.1 拍視頻就可以得到模型?基於視頻自動化生成模型
7.3.2 元宇宙版的神筆馬良,基於文本自動化生成三維模型
7.3.3 穿越空間,虛擬直播空間建設
7.3.4 元宇宙的化身——數字人生成技術
7.3.5 把實物帶到元宇宙中,基於三維雷射掃描設備的文物逆向建模
7.4 AIGC套用的未來
第8章 AI文明的降臨已開啟倒計時
8.1 何謂內容
8.2 AIGC的著作權爭議
8.3 普通人的AIGC時代生存建議
8.3.1 生產力工具:“人工”+“智慧型”=最強“打工人”
8.3.2 做AIGC套用的老師,為人類的“群體智慧”做貢獻
8.3.3 向AIGC套用學習邏輯,同時關注創新
後記

相關詞條

熱門詞條

聯絡我們