Stable Video Diffusion是Stability AI發布的視頻生成大模型,於2023年11月正式發布。
基於Stability AI原有的Stable Diffusion文生圖模型,Stable Video Diffusion可實現文生視頻。
基本介紹
- 外文名:Stable Video Diffusion
- 研發公司:Stability AI
Stable Video Diffusion是Stability AI發布的視頻生成大模型,於2023年11月正式發布。
基於Stability AI原有的Stable Diffusion文生圖模型,Stable Video Diffusion可實現文生視頻。
Stable Diffusion,是一種AI繪畫生成工具。Stability AI 於2023年6月發布新聞稿,宣布推出 SDXL 0.9 版本更新,升級了 Stable Diffusion 文本生成圖片模型。產品簡介 Stable Diffusion是一種AI繪畫生成工具。發展歷史 2022年11月,Stable...
LDM Nvidia Video LDM,是Nvidia研發的 文本轉視頻模型 。發展歷史 2023年,Nvidia公布了其基於Stable Diffusion 模型開發的文本轉視頻模型—— Nvidia Video LDM。主要功能 Nvidia通過對現有模型的微調,大大減少了生成視頻的過程和時間。
《AI創意繪畫與視頻製作:基於Stable Diffusion和ControlNet》是2023年清華大學出版社出版的圖書,作者是馬健健。內容簡介 《AI創意繪畫與視頻製作:基於Stable Diffusion和ControlNet》將帶領讀者探索AI繪畫和短視頻創作的奇妙世界。本書詳細...
《AI繪畫:Stable Diffusion從入門到精通》是2023年10月1日清華大學出版社出版的圖書,作者:許建 鋒。內容簡介 《AI繪畫:Stable Diffusion從入門到精通》從藝術教育工作者和現代藝術設計師的視角,系統地介紹了人工智慧繪畫的相關知識與...
3.4 嘗試用Stable Diffusion繪畫 / 051 3.4.1 利用“txt2img”繪畫 / 051 3.4.2 利用“img2img”繪畫 / 055 3.4.3 調整提示詞以最佳化畫面效果 / 057 3.5 嘗試進階操作 / 065 3.5.1 採樣方式和採樣步數的選擇...
《AI魔法繪畫:用Stable Diffusion挑戰無限可能》以實際操作為導向,詳細講解基於Stable Diffusion進行AI繪畫的完整學習路線,包括繪畫技巧、圖片生成、提示詞編寫、ControlNet外掛程式、模型訓練等。圖書目錄 --第1 章 Stable Diffusion AI 繪畫...
VideoPoet是谷歌團隊發布的全新的視頻生成模型。模型介紹 VideoPoet 主要包含以下幾個組件:預訓練的 MAGVIT V2 視頻 tokenizer 和 SoundStream 音頻 tokenizer,能將不同長度的圖像、視頻和音頻剪輯轉換成統一辭彙表中的離散代碼序列。這些...
《商用級AIGC繪畫創作與技巧(Midjourney+Stable Diffusion)》是2023年11月 1日清華大學出版社出版的圖書,作者:菅小 冬。內容簡介 《商用級AIGC繪畫創作與技巧(Midjourney+Stable Diffusion)》圍繞AI繪畫這個主題展開,介紹AI繪畫的基礎...
lexica 也是一個專注於 Stable Diffusion 模型的 prompt 搜尋引擎,其搜尋方式非常簡單,類似於 Krea,沒有 PromptHero 那樣的分類搜尋功能,但 lexica 能夠展示搜尋結果數量。除此之外,lexica 還提供了 AI 圖像生成功能,用戶可以對圖片...
《AIGC從入門到實戰:ChatGPT+Midjourney+Stable Diffusion+行業套用》是一本2023年人民郵電出版社出版的圖書,作者是韓澤耀、袁蘭、鄭妙韻。內容簡介 本書旨在探討AIGC(Artificial Intelligence Generated Content)的發展歷程、套用範圍及其...
Emu Video 是 Meta 推出的基於人工智慧的視頻編輯,可以根據純文本、純圖像或組合的文本和圖像輸入來生成視頻。發展歷程 2023年11月16日,Meta推出Emu Video功能,可用於在 Instagram 或 Facebook 上發布視頻。主要功能 Emu Video 是一...
Stable Diffusion XL,是一款 模型 ,2023年面向公眾測試 。發展歷史 2023年,Stable Diffusion XL面向公眾測試,可以在Clipdrop平台免費試用。主要功能 該模型相比之前版本改進如下:使用較短的描述性prompt即可生成高質量圖像,圖像中的人體...
Stable Video Diffusion 擴散模型 2023.11 谷歌 Video Poet Transformer 2023.12 位元組跳動 MagicVideo-V2 擴散模型 2024.01 參考資料: [8-9] Sora的優勢主要是三方面: 第一:可以生成長達60秒鐘的視頻,包括多個角色、特定類型動作和主題背...
2023年以來,隨著ChatGPT引發新一輪AI產業熱潮,百度亦加速在AIGC及多模態大模型領域的布局, 先後投資text-to-video生成技術與社區的初創企業Morph Studio、人工智慧公司西湖心辰及多模態大模型公司生數科技。騰訊:重視AI發展,內生+...