AIGC

AIGC

生成式人工智慧AIGC(Artificial Intelligence Generated Content)是人工智慧1.0時代進入2.0時代的重要標誌。

GAN、CLIP、Transformer、Diffusion、預訓練模型、多模態技術、生成算法等技術的累積融合,催生了AIGC的爆發。算法不斷疊代創新、預訓練模型引發AIGC技術能力質變,多模態推動AIGC內容多邊形,使得AIGC具有更通用和更強的基礎能力。

從計算智慧型、感知智慧型再到認知智慧型的進階發展來看,AIGC已經為人類社會打開了認知智慧型的大門。通過單個大規模數據的學習訓練,令AI具備了多個不同領域的知識,只需要對模型進行適當的調整修正,就能完成真實場景的任務。

AIGC對於人類社會、人工智慧的意義是里程碑式的。短期來看AIGC改變了基礎的生產力工具,中期來看會改變社會的生產關係,長期來看促使整個社會生產力發生質的突破,在這樣的生產力工具、生產關係、生產力變革中,生產要素——數據價值被極度放大。

AIGC把數據要素提到時代核心資源的位置,在一定程度上加快了整個社會的數位化轉型進程。

基本介紹

  • 中文名:生成式人工智慧
  • 外文名:Artificial Intelligence Generated Content
  • 簡稱:AIGC
  • 提出時間:約 1960年
  • 提出者:Alan Turing
概念與定義,產生背景,發展歷程,早期萌芽階段:1950-1990,沉積積累階段:1990-2010,快速發展階段:2010-至今,特徵,文本生成,圖像生成,語音生成,視頻生成,AIGC產業結構,基礎大模型,行業與場景中模型,業務與領域小模型,AI基礎設施,AIGC配套服務,AIGC關鍵技術能力,數據,算力,算法,AIGC商業套用領域,行銷場景,數字辦公場景,線上客服場景,人力資源,基礎作業,AIGC落地方式與路徑,直接使用,Prompt,LoRA,FineTune,Train,AIGC商業模式,MaaS+IaaS,MaaS+PaaS,MaaS+SaaS,收費模式,AIGC供給側能力評估模型,AIGC發展存在的問題,法律法規完善程度低,數據要素問題突出,技術保密性問題,完善措施,法律準入,數據服務產業鏈納入統一管理體系,技術標準統一和完善,社會影響,

概念與定義

生成式人工智慧——AIGC(Artificial Intelligence Generated Content),是指基於生成對抗網路、大型預訓練模型等人工智慧的技術方法,通過已有數據的學習和識別,以適當的泛化能力生成相關內容的技術。
AIGC技術的核心思想是利用人工智慧算法生成具有一定創意和質量的內容。通過訓練模型和大量數據的學習,AIGC可以根據輸入的條件或指導,生成與之相關的內容。例如,通過輸入關鍵字、描述或樣本,AIGC可以生成與之相匹配的文章、圖像、音頻等。
麥肯錫的定義:生成式人工智慧旨在通過以一種接近人類行為,(與人類)進行互動式協作。
Gartner的定義:生成式人工智慧是一種顛覆性的技術,它可以生成以前依賴於人類的工件,在沒有人類經驗和思維過程偏見的情況下提供創新的結果。
BCG的定義:生成式AI是一種突破性的人工智慧形式,它使用對抗網路(GANs)的深度學習技術來創建新穎的內容。
TE智庫的定義:生成式人工智慧,將徹底改變人機互動的關係,並創造新的產能輸出結構。它將在第四維度實現與人的思維同調,類似移動設備以人類外器官形態存在,AIGC將以外腦的形式存在於人類認知中。
南京大學數據智慧型與交叉創新實驗室:為伴隨著網路形態演化和人工智慧技術變革產生的一種新的生成式網路信息內容。
信通院的定義:AIGC既是從內容生產者視角進行分類的一類內容,又是一種內容生產方式,還是用於內容自動化生成的一類技術集合。

產生背景

1950年,艾倫•圖靈(Alan Turing)在其論文《計算機器與智慧型(Computing Machinery and Intelligence )》13中提出了著名的“圖靈測試”,給出了判定機器是否具有“智慧型”的試驗方法,即機器是否能夠模仿人類的思維方式來“生成”內容繼而與人互動。
某種程度上來說,人工智慧從那時起就被寄予了用於內容創造的期許。經過半個多世紀的發展,隨著數據快速積累、算力性能提升和算法效力增強,今天的人工智慧不僅能夠與人類進行互動,還可以進行寫作、編曲、繪畫、視頻製作等創意工作。
2018年,人工智慧生成的畫作在佳士得拍賣行以43.25萬美元成交,成為世界上首個出售的人工智慧藝術品,引發各界關注。隨著人工智慧越來越多地被套用於內容創作,人工智慧生成內容 (Artificial Intelligence Generated Content,簡稱AIGC)的概念悄然興起。

發展歷程

人工智慧的發展歷史大致可以被劃分為5個階段。(1950~1974)人工智慧概念的出現;(1974~1980)神經網路遇冷,研究經費減少;(1980~1987)專家系統流行並商用;(1987~1993)專家系統潰敗,研究經費大減;(1993~至今)深度學習理論和工程突破。
使用計算機生成內容的想法自上個世紀五十年代就已經出現,早期的嘗試側重於通過讓計算機生成照片和音樂來模仿人類的創造力,生成的內容也無法達到高水平的真實感。結合人工智慧的演進改革,AIGC的發展可以大致分為以下三個階段:

早期萌芽階段:1950-1990

受限於科技水平,AIGC僅限於小範圍實驗。1957年,萊杰倫·希勒(Lejaren Hiller)和倫納德·艾薩克森(Leonard Isaacson)通過將電腦程式中的控制變數改為音符,完成了歷史上第一部由計算機創作的音樂作品——弦樂四重奏《依利亞克組曲(Illiac Suite)》。1966年,約瑟夫·韋岑鮑姆(JosephWeizenbaum)和肯尼斯·科爾比(Kenneth Colbv)共同開發了世界上第一個機器人“伊莉莎(Eliza)”,其通過關鍵字掃描和重組來完成互動式任務。80年代中期,IBM基於隱馬爾可夫鏈模型創造了語音控制打字機“坦戈拉(Tangora)”,能夠處理兩萬個單詞。

沉積積累階段:1990-2010

AIGC從實驗性向實用性逐漸轉變,深度學習算法、圖形處理單元(GPU)、張量處理器(TPU)和訓練數據規模等都取得了重大突破,受到算法瓶頸的限制,效果有待提升。2007年,紐約大學人工智慧研究員羅斯·古德溫(Ross Goodwin)裝配的人工智慧系統通過對公路旅行中的所見所聞進行記錄和感知,撰寫出世界上第一部完全由人工智慧創作的小說《1 The Road》。2012年,微軟公開展示了一個全自動同聲傳譯系統,通過深度神經網路(DNN)可以自動將英文演講者的內容通過語音識別、語言翻譯、語音合成等技術生成中文語音。

快速發展階段:2010-至今

深度學習模型不斷疊代,AIGC取得突破性進展。尤其在2022年,算法獲得井噴式發展,底層技術的突破也使得AIGC商業落地成為可能。其中主要集中在AI繪畫領域:2014年6月,生成式對抗網路(Generative Adversarial Network,GAN)被提出。2021年2月,OpenAI推出了CLIP(Contrastive Language-Image Pre-Training)多模態預訓練模型。2022年,擴散模型Diffusion Model逐漸替代GAN。

特徵

AIGC是建立在多模態之上的人工智慧技術,即單個模型可以同時理解語言、圖像、視頻、音頻等,並能夠完成單模態模型無法完成的任務,比如給視頻添加文字描述、結合語義語境生成圖片等。
現階段國內AIGC多以單模型套用的形式出現,主要分為文本生成、圖像生成、視頻生成、音頻生成,其中文本生成成為其他內容生成的基礎。

文本生成

文本生成(AI Text Generation),人工智慧文本生成是使用人工智慧(AI)算法和模型來生成模仿人類書寫內容的文本。它涉及在現有文本的大型數據集上訓練機器學習模型,以生成在風格、語氣和內容上與輸入數據相似的新文本。

圖像生成

圖像生成(AI Image Generation),人工智慧(AI)可用於生成非人類藝術家作品的圖像。這種類型的圖像被稱為“人工智慧生成的圖像”。人工智慧圖像可以是現實的或抽象的,也可以傳達特定的主題或信息。

語音生成

語音生成(AI Audio Generation),AIGC的音頻生成技術可以分為兩類,分別是文本到語音合成和語音克隆。文本到語音合成需要輸入文本並輸出特定說話者的語音,主要用於機器人和語音播報任務。到目前為止,文本轉語音任務已經相對成熟,語音質量已達到自然標準,未來將向更具情感的語音合成和小樣本語音學習方向發展;語音克隆以給定的目標語音作為輸入,然後將輸入語音或文本轉換為目標說話人的語音。此類任務用於智慧型配音等類似場景,合成特定說話人的語音。

視頻生成

視頻生成(AI Video Generation),AIGC已被用於視頻剪輯處理以生成預告片和宣傳視頻。工作流程類似於圖像生成,視頻的每一幀都在幀級別進行處理,然後利用 AI 算法檢測視頻片段。AIGC生成引人入勝且高效的宣傳視頻的能力是通過結合不同的AI算法實現的。憑藉其先進的功能和日益普及,AIGC可能會繼續革新視頻內容的創建和行銷方式。

AIGC產業結構

AI產業鏈主要由基礎層、技術層、套用層三大層構成。其中基礎層側重於基礎支撐平台的搭建,包含感測器AI晶片、數據服務和計算平台;技術層側重核心技術的研發,主要包括算法模型、基礎框架、通用技術;套用層注重產業套用發展主要包含行業解決方案服務、硬體產品和軟體產品
調研歸納發現,國內AIGC產業鏈結構主要由基礎大模型、行業/場景中模型、業務/領域小模型,AI基礎設施、AIGC配套服務五部分構成,並且已經形成了豐富的產業鏈。
AIGC
圖片來源:TE智庫《企業AIGC商業落地套用研究報告》

基礎大模型

通過大量無標籤或通用公開數據集,在數百萬或數十億參數量下,訓練的深度神經網路模型。這種模型經過專門的訓練過程,能夠對大規模數據進行複雜的處理和任務處理。大模型需要占用大量的計算資源、存儲空間、時間和電力等資源來保證它的訓練和部署。

行業與場景中模型

基於行業/場景專有數據,在較小參數量下訓練的深度神經網路模型。面向特定場景和行業,該模型運行速度更快,也更加輕便。
代表供應商類型:行業頭部數位化供應商、AI廠商、行業巨頭、基礎大模型廠商、數據服務供應商。

業務與領域小模型

基於少量、特定領域或企業獨有數據,在小規模參數下訓練的深度神經網路模型。適用於解決一些簡單的、小規模的問題,可以在低功耗設備上運行,具有更快的推理速度。
代表供應商類型:垂直領域數位化服務供應商(包含SaaS服務供應商)、行業巨頭、AI廠商、基礎大模型廠商。

AI基礎設施

為模型廠商提供算力、算法、數據服務三大套件支持,包括伺服器、晶片、數據湖、數據分析能力。

AIGC配套服務

圍繞大模型,提供建模工具、安全服務、內容檢測、基礎平台等服務。
AIGC產業鏈上游主要提供AI技術及基礎設施,包括數據供給方、數據分析及標註、創造者生態層、相關算法等。中游主要針對文字、圖像、視頻等垂直賽道,提供數據開發及管理工具,包括內容設計、運營增效、數據梳理等服務。下游包括內容終端市場、內容服務及分發平台、各類數字素材以及智慧型設備,AIGC內容檢測等。

AIGC關鍵技術能力

實現AIGC更加智慧型化、實用化的三大要素是:數據算力算法

數據

AIGC人有我優的核心基礎,包括存儲(集中式資料庫、分散式資料庫、雲原生資料庫、向量資料庫)、來源(用戶數據、公開域數據、私有域數據)、形態(結構化數據、非結構化數據)、處理(篩選、標註、處理、增強…)

算力

為AIGC提供基礎算力的平台,包括半導體(CPUGPU、DPU、TPU、NPU)、伺服器、大模型算力集群、基於IaaS搭建分散式訓練環境、自建數據中心部署。

算法

通過模型設計、模型訓練、模型推理、模型部署步驟,完成從機器學習平台、模型訓練平台到自動建模平台的構建,實現對實際業務的支撐與覆蓋。

AIGC商業套用領域

國外AIGC的商業化從基礎大模型開始,包括以ChatGPTMidjourney為代表的典型套用是基於基礎大模型的調用,孵化而來。
國內正好相反,由於國內市場極度豐富的業務場景,高度離散的供給側服務,導致當前的AIGC商業化先從業務/領域小模型開始。基礎大模型尚處於快速疊代升級的階段,同時也開始關注具體的業務場景。而行業/場景中模型市場相對更加滯後,但這一市場在中國特色市場下,將會是未來基礎大模型和領域小模型都會積極跨界的領域。
目前國內的AIGC技術與套用,供需兩側主要集中在行銷、辦公、客服、人力資源、基礎作業等領域,並且這種技術所帶來的賦能與價值已經初步得到驗證。根據TE智庫《企業AIGC商業落地套用研究報告》顯示,33%企業在行銷場景、31.9%的企業在線上客服領域、27.1%的企業在數字辦公場景下、23.3%的企業在信息化與安全場景下迫切期望AIGC的加強和支持。
AIGC
圖片來源:TE智庫《企業AIGC商業落地套用研究報告》

行銷場景

行銷場景是目前AIGC滲透最快,也是套用最成熟的場景。AIGC主要在行銷動作中的內容生產、策略生成方面極大加強了數字行銷的能力。
例如市場認知階段的核心價值是創意參考,可賦能環節包括:廣告策略、品牌傳播、市場分析、CEM、SEO、DSP、SSP,通過生成廣告創意與投放最佳化參考,包括廣告設計、廣告內容、投放渠道策略和投放分析,從而提高廣告效果和投放效率。

數字辦公場景

數字辦公場景也是目前AIGC滲透較快的場景之一,主要體現在對個體的辦公效率提升。在文本內容生成、代碼生成、流程設計和規範等方面表現出一定的提示和最佳化。
例如流程管理模組的核心價值是規範建議,可賦能環節包括:流程規範設計、流程路徑設計、流程控制設計、流程最佳化,在一個新項目啟動時,可以根據項目需求和歷史經驗自動生成流程規範建議,包括各階段的任務分配、時間節點等。

線上客服場景

線上客服是AIGC音頻生成最近距離的場景之一,聲音合成、語義理解在智慧型化策略下,生成具有明確目的性的對話內容。
例如全渠道接入模組的核心價值在於個性化模組,可賦能的環節:富文本溝通、自動主動對話、訪客信息展現,生成個性化回復模板,更好地提供針對性服務,從而提升客戶滿意度。

人力資源

AIGC對人力資源服務的加成,是目前在企業經營管理體系中進展較快的領域。使人力資源管理體系的效率大幅提升的同時,在一定程度上也改變了傳統人力三支柱的傳統管理模型。
例如招聘模組的核心價值在於簡歷推薦,可賦能的環節:篩選、面試篩選、筆試測評,以篩選簡歷階段為例,可以分析各個候選人的簡歷,生成匹配結果報告,並根據公司需求智慧型推薦合適的候選人。大幅提高篩選準確性和效率,減少人力資源部門的工作負擔。

基礎作業

AIGC在基礎作業場景中的表現十分突出,在設計、電子簽名、契約管理、法律服務等環節表現出很強的智慧型化以及可替代性。
設計構思模組的核心價值在於創意輔助,可賦能的環節:設計對接、溝通設計思路,當企業開始設計時,可以根據客戶需求,自動轉化設計對接,同時輔助設計不同風格方案生成,提升設計師的創意水平。
核心價值在於契約草稿生成、內容自動審核、契約完整性確認,可賦能的環節:契約製作、業務部門內部審核、審核確認、財務審核、法務審核、審核確認、領導審核、審核確認、最終審核,存檔,能夠根據企業需求和行業標準,自動識別關鍵信息並生成契約草稿,提高契約起草質量,節省企業起草契約所需時間;自動分析契約內容,為業務部門審核契約提供有效建議,提高審核效率,降低契約執行潛在風險;可以基於已完成的契約審核意見及修改意見,確保契約完成,生成最終契約文檔。

AIGC落地方式與路徑

目前企業/機構端在使用相關的AIGC能力時,主要有五種方式:直接使用、Prompt、LoRA、Finetune、Train。

直接使用

顧名思義,直接使用基礎大模型廠商發布的產品服務,通過接口調用方式嵌入自身業務或系統當中。

Prompt

通過提示工程,通過微調少量參數,引導預訓練語言模型做特定下游任務。利用文本對話方式操控語言大模型,引導生成結果。

LoRA

僅訓練低秩矩陣(low rank matrics),使用時將LoRA模型的參數注入基礎大模型,在不修改大模型的前提下,改變模型的生成風格。所需的訓練資源比訓練基礎大模型要小很多,非常適合社區使用者和個人開發者。

FineTune

Finetune是套用或利用遷移學習的一種方式。對基礎大模型進行微調,以適應特定任務。
當數據集相似,但數據量又很少的情況下,微調省去大量計算資源和計算時間,提高了計算效率,甚至提高準確率。具體來說,微調是一個過程,它採用已經針對一項給定任務訓練過的模型,然後調整或微調模型以使其執行第二個類似任務。

Train

調用數據、算力、算法從頭訓練大模型,從頭開始訓練大模型。除非特殊領域和特定要求,一般商業公司不會從頭開始訓練基礎大模型。

AIGC商業模式

目前AIGC主要的商業模式為MaaS(Model as a service),MaaS是一種雲與大模型深度綁定後的新商業模式,以云為基礎、模型為中心,提供眾多預訓練基礎模型,只需針對具體場景作調整最佳化,就能夠快速投入使用。
MaaS與雲計算各層的商業結合,將會引發企業市場一場新的商業模式變革。
AIGC
圖片來源:TE智庫《企業AIGC商業落地套用研究報告》
MaaS由三部分組成,包括基礎層、中間核心層和底層擴展層。基礎層涵蓋了用戶的身份信息,如用戶姓名和職業等基本信息;中間核心層描述了重要的用戶特徵,如用戶興趣、偏好、目標等;底層擴展層包含帶有用戶特徵的個性化知識,包括通過語義關係分析和推理得到的用戶興趣、偏好和個性化的模型網路。
這個平台可作為獨立的服務平台,插入到雲計算中,具體位置在PaaS層和SaaS層之間。因此在商業模式上可以是MaaS+IaaS、MaaS+PaaS、MaaS+SaaS。

MaaS+IaaS

MaaS開發人員設計的所有MaaS配置檔案模板都存儲在IaaS層中,也就是說用IaaS層的資料庫餵給MaaS。這意味著MaaS的質量也取決於IaaS層資料庫的質量,其中包括關係型資料庫NewSQL數據倉庫數據湖等對數據的處理。

MaaS+PaaS

MaaS主要針對PaaS的構建和開發模式產生巨大影響,縮短PaaS的開發周期。原來PaaS層的服務主要依賴與在某一領域的專業深耕,垂直化PaaS的價值得以放大。而MaaS的介入,在理論上使得通用PaaS服務成為可能,並且PaaS服務對象直接賦能最終B端客戶,不再局限交付團隊。

MaaS+SaaS

這是目前AIGC與企業業務結合最具想像力的商業模式,SaaS+MaaS能為每個終端用戶,輸出針對自己業務的個性化服務。
客戶可以直接將需求傳遞給系統,它會自動調用功能、展示結果。區別在於,通過MaaS平台搭建出的SaaS軟體會展現出更個性化的工具,其效果可能要好過PaaS+SaaS的模式。最後,SaaS的訂閱模式也會因此發生改變。

收費模式

數據調研發現,中國企業用戶在AIGC的付費模式期望方面開始出現明確的方向。對MaaS的收費模式主要分為三類:訂閱收費、按內容產出量收費、定製模型開發收費。
AIGC
圖片來源:TE智庫《企業AIGC商業落地套用研究報告》

AIGC供給側能力評估模型

判斷一個組織或機構在AIGC時代的商業化潛能,可以從四個維度加以驗證:團隊、創新、市場、生態。
AIGC
圖片來源:TE智庫《企業AIGC商業落地套用研究報告》

AIGC發展存在的問題

法律法規完善程度低

目前AIGC相關的法律法規不完善是主要問題,想要實現對AIGC技術的有效發揮,必須對其相關的法律法規進行完善。就當前的AIGC技術在目前的套用來看,其缺乏完善的安全性標準,沒有明確AIGC技術服務、內容傳播與技術套用各相關方面的法律和社會責任。其次,缺乏完善的AIGC技術相關立法,與分級分類的監管手段,AIGC技術的安全性難以得到保障。

數據要素問題突出

在AIGC技術的使用中,沒有明確劃分公有數據和專有數據的使用界限,使基礎大模型訓練的數據合規性、安全性、權屬產生問題。例如,專有數據的泄露可能會導致用戶數據安全的問題,同時數據要素也很難有效的發揮出自己的價值。

技術保密性問題

技術保密性是AIGC的首要問題。比如,在與AIGC互動的過程中,企業的專有資源被泄露等。如果技術保密性不足就可能嚴重影響到信息資源的所有者。

完善措施

法律準入

隨著AIGC技術的不斷發展,AI套用的領域日益廣泛,為了更好地規範市場發展,建議逐步完善保障AIGC良性發展的法律法規體系,建立法律準入體系。開展針對AIGC模型市場準入方面的法律法規研究,從而明確AIGC技術服務、內容傳播與技術套用各相關方面的法律和社會責任。同時,鼓勵立法研究的多方參與、監管手段的分級分類、行業治理的公私合作。

數據服務產業鏈納入統一管理體系

數據是AIGC發展的三大根基之一,加強數據要素安全,是AI技術安全落地的基礎。首先,可以加強各級單位對於數據要素的治理,分級分層建立數據要素安全標準,如網路安全等級保護、數據分類分級管理、合規管理體系的搭建以及安全事件的防範等方面建立完善的解決方案。

技術標準統一和完善

技術是AIGC發展的核心,加強技術的獨立可控是AIGC發展的重要手段。可以在基礎大模型階段開始實施技術標準、業務標準的制定,從起步階段完善產業鏈體系的標準化。
同時加強數據歸集、算力統籌、算法開源等平台和基礎能力建設等;同時最佳化AIGC技術的發展環境,通過技術創新、理念創新,進一步適應新的發展環境,提高技術的套用價值,是未來AIGC技術的發展重點。

社會影響

2023年12月,AIGC入選2023年十大科技熱詞。

相關詞條

熱門詞條

聯絡我們