生成式人工智慧AIGC(Artificial Intelligence Generated Content)是人工智慧 1.0時代進入2.0時代的重要標誌。
GAN、CLIP、Transformer、Diffusion、預訓練模型、多模態技術、生成算法等技術的累積融合,催生了AIGC的爆發。算法不斷疊代創新、預訓練模型引發AIGC技術能力質變,多模態推動AIGC內容多邊形,使得AIGC具有更通用和更強的基礎能力。
從計算智慧型、感知智慧型再到認知智慧型的進階發展來看,AIGC已經為人類社會打開了認知智慧型的大門。通過單個大規模數據的學習訓練,令AI具備了多個不同領域的知識,只需要對模型進行適當的調整修正,就能完成真實場景的任務。
AIGC對於人類社會、人工智慧的意義是里程碑式的。短期來看AIGC改變了基礎的生產力工具,中期來看會改變社會的生產關係,長期來看促使整個社會生產力發生質的突破,在這樣的生產力工具、生產關係、生產力變革中,生產要素——數據價值被極度放大。
AIGC把數據要素提到時代核心資源的位置,在一定程度上加快了整個社會的數位化轉型進程。
基本介紹
中文名 :生成式人工智慧外文名 :Artificial Intelligence Generated Content簡稱 :AIGC提出時間 :約 1960年提出者 :Alan Turing
概念與定義,產生背景,發展歷程,早期萌芽階段:1950-1990,沉積積累階段:1990-2010,快速發展階段:2010-至今,特徵,文本生成,圖像生成,語音生成,視頻生成,AIGC產業結構,基礎大模型,行業與場景中模型,業務與領域小模型,AI基礎設施,AIGC配套服務,AIGC關鍵技術能力,數據,算力,算法,AIGC商業套用領域,行銷場景,數字辦公場景,線上客服場景,人力資源,基礎作業,AIGC落地方式與路徑,直接使用,Prompt,LoRA,FineTune,Train,AIGC商業模式,MaaS+IaaS,MaaS+PaaS,MaaS+SaaS,收費模式,AIGC供給側能力評估模型,AIGC發展存在的問題,法律法規完善程度低,數據要素問題突出,技術保密性問題,完善措施,法律準入,數據服務產業鏈納入統一管理體系,技術標準統一和完善,社會影響,
概念與定義 生成式人工智慧——AIGC(Artificial Intelligence Generated Content),是指基於
生成對抗網路 、大型預訓練模型等人工智慧的技術方法,通過已有數據的學習和識別,以適當的泛化能力生成相關內容的技術。
AIGC技術的核心思想是利用人工智慧算法生成具有一定創意和質量的內容。通過訓練模型和大量數據的學習,AIGC可以根據輸入的條件或指導,生成與之相關的內容。例如,通過輸入關鍵字、描述或樣本,AIGC可以生成與之相匹配的文章、圖像、音頻等。
麥肯錫的定義: 生成式人工智慧旨在通過以一種接近人類行為,(與人類)進行互動式協作。
Gartner的定義: 生成式人工智慧是一種顛覆性的技術,它可以生成以前依賴於人類的工件,在沒有人類經驗和思維過程偏見的情況下提供創新的結果。
BCG的定義: 生成式AI是一種突破性的人工智慧形式,它使用對抗網路(GANs)的深度學習技術來創建新穎的內容。
TE智庫的定義: 生成式人工智慧,將徹底改變人機互動的關係,並創造新的產能輸出結構。它將在第四維度實現與人的思維同調,類似移動設備以人類外器官形態存在,AIGC將以外腦的形式存在於人類認知中。
南京大學數據智慧型與交叉創新實驗室: 為伴隨著網路形態演化和人工智慧技術變革產生的一種新的生成式網路信息內容。
信通院的定義: AIGC既是從內容生產者視角進行分類的一類內容,又是一種內容生產方式,還是用於內容自動化生成的一類技術集合。
產生背景 1950年,艾倫•圖靈(Alan Turing)在其論文《計算機器與智慧型(Computing Machinery and Intelligence )》13中提出了著名的“圖靈測試”,給出了判定機器是否具有“智慧型”的試驗方法,即機器是否能夠模仿人類的思維方式來“生成”內容繼而與人互動。
某種程度上來說,人工智慧從那時起就被寄予了用於內容創造的期許。經過半個多世紀的發展,隨著數據快速積累、算力性能提升和算法效力增強,今天的人工智慧不僅能夠與人類進行互動,還可以進行寫作、編曲、繪畫、視頻製作等創意工作。
2018年,人工智慧生成的畫作在佳士得拍賣行以43.25萬美元成交,成為世界上首個出售的人工智慧藝術品,引發各界關注。隨著人工智慧越來越多地被套用於內容創作,人工智慧生成內容 (Artificial Intelligence Generated Content,簡稱AIGC)的概念悄然興起。
發展歷程 人工智慧的發展歷史大致可以被劃分為5個階段。(1950~1974)人工智慧概念的出現;(1974~1980)神經網路遇冷,研究經費減少;(1980~1987)專家系統流行並商用;(1987~1993)專家系統潰敗,研究經費大減;(1993~至今)深度學習理論和工程突破。
使用計算機生成內容的想法自上個世紀五十年代就已經出現,早期的嘗試側重於通過讓計算機生成照片和音樂來模仿人類的創造力,生成的內容也無法達到高水平的真實感。結合人工智慧的演進改革,AIGC的發展可以大致分為以下三個階段:
早期萌芽階段:1950-1990 受限於科技水平,AIGC僅限於小範圍實驗。1957年,萊杰倫·希勒(Lejaren Hiller)和倫納德·艾薩克森(Leonard Isaacson)通過將電腦程式中的控制變數改為音符,完成了歷史上第一部由計算機創作的音樂作品——弦樂四重奏《依利亞克組曲(Illiac Suite)》。1966年,約瑟夫·韋岑鮑姆(JosephWeizenbaum)和肯尼斯·科爾比(Kenneth Colbv)共同開發了世界上第一個機器人“伊莉莎(Eliza)”,其通過關鍵字掃描和重組來完成互動式任務。80年代中期,IBM基於隱馬爾可夫鏈模型創造了語音控制打字機“坦戈拉(Tangora)”,能夠處理兩萬個單詞。
沉積積累階段:1990-2010 AIGC從實驗性向實用性逐漸轉變,深度學習算法、圖形處理單元(GPU)、張量處理器(TPU)和訓練數據規模等都取得了重大突破,受到算法瓶頸的限制,效果有待提升。2007年,紐約大學人工智慧研究員羅斯·古德溫(Ross Goodwin)裝配的人工智慧系統通過對公路旅行中的所見所聞進行記錄和感知,撰寫出世界上第一部完全由人工智慧創作的小說《1 The Road》。2012年,微軟公開展示了一個全自動同聲傳譯系統,通過深度神經網路(DNN)可以自動將英文演講者的內容通過語音識別、語言翻譯、語音合成等技術生成中文語音。
快速發展階段:2010-至今 深度學習模型不斷疊代,AIGC取得突破性進展。尤其在2022年,算法獲得井噴式發展,底層技術的突破也使得AIGC商業落地成為可能。其中主要集中在AI繪畫領域:2014年6月,生成式對抗網路(Generative Adversarial Network,GAN)被提出。2021年2月,OpenAI推出了CLIP(Contrastive Language-Image Pre-Training)多模態預訓練模型。2022年,擴散模型Diffusion Model逐漸替代GAN。
特徵 AIGC是建立在多模態之上的人工智慧技術,即單個模型可以同時理解語言、圖像、視頻、音頻等,並能夠完成單模態模型無法完成的任務,比如給視頻添加文字描述、結合語義語境生成圖片等。
現階段國內AIGC多以單模型套用的形式出現,主要分為文本生成、圖像生成、視頻生成、音頻生成,其中文本生成成為其他內容生成的基礎。
文本生成 文本生成(AI Text Generation),人工智慧文本生成是使用人工智慧(AI)算法和模型來生成模仿人類書寫內容的文本。它涉及在現有文本的大型數據集上訓練機器學習模型,以生成在風格、語氣和內容上與輸入數據相似的新文本。
圖像生成 圖像生成(AI Image Generation),人工智慧(AI)可用於生成非人類藝術家作品的圖像。這種類型的圖像被稱為“人工智慧生成的圖像”。人工智慧圖像可以是現實的或抽象的,也可以傳達特定的主題或信息。
語音生成 語音生成(AI Audio Generation),AIGC的音頻生成技術可以分為兩類,分別是文本到語音合成和語音克隆。文本到語音合成需要輸入文本並輸出特定說話者的語音,主要用於機器人和語音播報任務。到目前為止,文本轉語音任務已經相對成熟,語音質量已達到自然標準,未來將向更具情感的語音合成和小樣本語音學習方向發展;語音克隆以給定的目標語音作為輸入,然後將輸入語音或文本轉換為目標說話人的語音。此類任務用於智慧型配音等類似場景,合成特定說話人的語音。
視頻生成 視頻生成(AI Video Generation),AIGC已被用於視頻剪輯處理以生成預告片和宣傳視頻。工作流程類似於圖像生成,視頻的每一幀都在幀級別進行處理,然後利用 AI 算法檢測視頻片段。AIGC生成引人入勝且高效的宣傳視頻的能力是通過結合不同的AI算法實現的。憑藉其先進的功能和日益普及,AIGC可能會繼續革新視頻內容的創建和行銷方式。
AIGC產業結構 AI產業鏈主要由基礎層、技術層、套用層三大層構成。其中基礎層側重於基礎支撐平台的搭建,包含
感測器 、
AI晶片 、數據服務和計算平台;技術層側重核心技術的研發,主要包括算法模型、基礎框架、通用技術;套用層注重產業套用發展主要包含行業解決方案服務、硬體產品和
軟體產品 。
調研歸納發現,國內AIGC產業鏈結構主要由基礎大模型、行業/場景中模型、業務/領域小模型,AI基礎設施、AIGC配套服務五部分構成 ,並且已經形成了豐富的產業鏈。
圖片來源:TE智庫《企業AIGC商業落地套用研究報告》 基礎大模型 通過大量無標籤或通用公開數據集,在數百萬或數十億參數量下,訓練的深度神經網路模型。這種模型經過專門的訓練過程,能夠對大規模數據進行複雜的處理和任務處理。大模型需要占用大量的計算資源、存儲空間、時間和電力等資源來保證它的訓練和部署。
行業與場景中模型 基於行業/場景專有數據,在較小參數量下訓練的深度神經網路模型。面向特定場景和行業,該模型運行速度更快,也更加輕便。
代表供應商類型:行業頭部數位化供應商、AI廠商、行業巨頭、基礎大模型廠商、數據服務供應商。
業務與領域小模型 基於少量、特定領域或企業獨有數據,在小規模參數下訓練的深度神經網路模型。適用於解決一些簡單的、小規模的問題,可以在低功耗設備上運行,具有更快的推理速度。
代表供應商類型:垂直領域數位化服務供應商(包含SaaS服務供應商)、行業巨頭、AI廠商、基礎大模型廠商。
AI基礎設施 為模型廠商提供算力、算法、數據服務三大套件支持,包括伺服器、晶片、數據湖、數據分析能力。
AIGC配套服務 圍繞大模型,提供建模工具、安全服務、內容檢測、基礎平台等服務。
AIGC產業鏈上游主要提供AI技術及基礎設施,包括數據供給方、數據分析及標註、創造者生態層、相關算法等。中游主要針對文字、圖像、視頻等垂直賽道,提供數據開發及管理工具,包括內容設計、運營增效、數據梳理等服務。下游包括內容終端市場、內容服務及分發平台、各類數字素材以及智慧型設備,AIGC內容檢測等。
AIGC關鍵技術能力 實現AIGC更加智慧型化、實用化的三大要素是:
數據 、
算力 、
算法 。
數據 AIGC人有我優的核心基礎,包括存儲(集中式資料庫、分散式資料庫、雲原生資料庫、向量資料庫)、來源(用戶數據、公開域數據、私有域數據)、形態(結構化數據、非結構化數據)、處理(篩選、標註、處理、增強…)
算力 為AIGC提供基礎算力的平台,包括半導體(
CPU 、
GPU 、DPU、TPU、NPU)、
伺服器 、大模型算力集群、基於IaaS搭建分散式訓練環境、自建數據中心部署。
算法 通過模型設計、模型訓練、模型推理、模型部署步驟,完成從機器學習平台、模型訓練平台到自動建模平台的構建,實現對實際業務的支撐與覆蓋。
AIGC商業套用領域 國內正好相反,由於國內市場極度豐富的業務場景,高度離散的供給側服務,導致當前的AIGC商業化先從業務/領域小模型開始。基礎大模型尚處於快速疊代升級的階段,同時也開始關注具體的業務場景。而行業/場景中模型市場相對更加滯後,但這一市場在中國特色市場下,將會是未來基礎大模型和領域小模型都會積極跨界的領域。
目前國內的AIGC技術與套用,供需兩側主要集中在行銷、辦公、客服、人力資源、基礎作業等領域,並且這種技術所帶來的賦能與價值已經初步得到驗證。根據TE智庫《企業AIGC商業落地套用研究報告》顯示,33%企業在行銷場景、31.9%的企業在線上客服領域、27.1%的企業在數字辦公場景下、23.3%的企業在信息化與安全場景下迫切期望AIGC的加強和支持。
圖片來源:TE智庫《企業AIGC商業落地套用研究報告》 行銷場景 行銷場景是目前AIGC滲透最快,也是套用最成熟的場景。AIGC主要在行銷動作中的內容生產、策略生成方面極大加強了數字行銷的能力。