計算美學AIGC圖像生成算法

計算美學AIGC圖像生成算法是北京計算美學科技有限公司旗下的深度合成服務算法。該算法套用於圖像生成場景,根據輸入的文本、待處理圖像、蒙版等,結合必要的圖像分割、識別模組,經過圖像生成模型,生成與輸入匹配的圖像。套用產品為畫宇宙AI商品作圖(網站)、畫宇宙(網站)。

2023年8月,計算美學AIGC圖像生成算法通過備案。

基本介紹

  • 軟體名稱:計算美學AIGC圖像生成算法
  • 開發商:北京計算美學科技有限公司
  • 角色:服務提供者
  • 備案編號:網信算備110108210709901230015號
算法原理,運行機制,套用場景,算法目的,

算法原理

計算美學 AIGC 圖像生成算法是使了用北京計算美學科技有限公司(Nolibox)自研的算法框架、基於擴散模型和一系列配套技術的算法。計算美學 AIGC 圖像生成算法的主體模型是擴散模型(latent diffusion model, LDM)。模型由3 個部分組成:變分自編碼器(VAE)、U-Net 和一個文本編碼器。與其學習去噪圖像數據(在“像素空間”中),而是訓練VAE 將圖像轉換為低維潛在空間。添加和去除高斯噪聲的過程被套用於這個潛在表示,然後將最終的去噪輸出解碼到像素空間中。在前向擴散過程中,高斯噪聲被疊代地套用於壓縮的潛在表征。每個去噪步驟都由一個包含殘差神經網路(ResNet)中堅的U-Net 架構完成,通過從前向擴散往反方向去噪而獲得潛在表征。最後,VAE解碼器通過將表征轉換回像素空間來生成輸出圖像。去噪步驟可以以文本串、圖像或一些其他數據為條件。調節數據的編碼通過交叉注意機制(cross-attention mechanism)暴露給去噪U-Net 的架構。為了對文本進行調節,一個預訓練的固定CLIP ViT-L/14 文本編碼器被用來將提示詞轉化為嵌入空間。

運行機制

- 計算美學 AIGC 圖像生成算法的“輸出”是:圖像;- 該算法的“輸入”支持多模態數據,包括:文本(自然語言)、圖像(參考圖、控制信息、待處理的圖片)、蒙版(指定繪圖區域)等;- 基於以上的輸入輸出,該算法可提供的功能包括:文本生成圖像、圖像生成圖像、帶有控制信息的圖像生成、圖像處理(局部重繪、圖像外延、圖像高清化等)。

套用場景

畫宇宙(應用程式)、畫宇宙開放平台(應用程式)、畫宇宙AI商品圖(應用程式)、圖宇宙(應用程式)

算法目的

1. 通過 AIGC 圖像算法輔助創意、輔助設計,提升設計用圖類場景的工作效率;2. 提升照片修圖美化效率、內容豐富度;3. 降低設計創意門檻,通過文字輸入、參考圖輸入等方式,讓沒有美術或設計基礎的用戶也能生成符合自己意圖的圖片,以滿足大眾的審美需求和創作愛好;4. 可快速產生符合行業需求的圖片,滿足運營、行銷等場景的用圖和投放需求。
check!

熱門詞條

聯絡我們