AutoStudio：能做漫畫的AI，多輪對話保持一致風格！

2024年06月28日00:22:14 科技 1026

在當今的AI的帶領下域，圖像生成技術正不斷取得令人矚目的進展。今天要給大家介紹一個能幫你生成漫畫的技術：AutoStudio

AutoStudio是什麼？

AutoStudio是一個先進的AI工具，它能夠在多輪對話中與用戶互動，生成一系列主題和風格一致的圖像。

無論用戶如何添加或修改內容，AutoStudio都能保持圖像生成的一致性，特別適合連環畫創作和其他需要連貫視覺敘事的場景。

AutoStudio如何做到的？

它是一個無需訓練的多智能體框架，採用了基於大型語言模型（LLMs）的三個智能體來處理交互，同時結合了基於穩定擴散（SD）的智能體來生成高質量圖像。

具體來說，AutoStudio 由以下部分組成：

主題管理器：解釋交互對話並管理每個主題的上下文。
布局生成器：生成細粒度的邊界框來控制主題位置。
監督員：為布局改進提供建議。
繪製器：根據改進的布局和主題資料庫完成圖像生成。

此外，AutoStudio 還引入了 Parallel-UNet 來取代繪製器中的原始 UNet，它採用了兩個並行的交叉注意力模塊來利用主題感知特徵。同時，還引入了主題初始化生成方法，以更好地保留小主題。

性能如何？

通過這些創新，AutoStudio 能夠互動式地、一致地生成多主題的圖像序列。在公共 CMIGBench 基準和人工評估的廣泛實驗中，AutoStudio 很好地保持了多輪交互中的多主題一致性，並且在平均 Frechet Inception Distance 方面將現有技術水平提高了 13.65%，在平均字元 - 字元相似性方面提高了 2.83%。

代碼地址：

https://github.com/donahowe/AutoStudio

科技

科研成果從實驗台走進車間！39位「科技副總」上任 - 天天要聞

科研成果從實驗台走進車間！39位「科技副總」上任

讓人才從象牙塔走入企業，科研成果從實驗台走進車間，北京科技成果轉化再結碩果。

06月30日 1770

張雪峰看好的三大專業-張雪峰十大高薪專業排行榜 - 天天要聞

張雪峰看好的三大專業-張雪峰十大高薪專業排行榜

在當今社會，科技的飛速發展和經濟的蓬勃向前為各個專業領域帶來了前所未有的機遇和挑戰。在這樣的大背景下，越來越多的專業得到了社會各界的廣泛關注和認可。作為一位資深的教育專家，張雪峰憑藉他深厚的學術背景和敏銳的市場洞察力，對未來就業市場的發展趨

06月30日 1768

崔東樹：2024年5月充電樁數量增長7.29萬個 - 天天要聞

崔東樹：2024年5月充電樁數量增長7.29萬個

鞭牛士 6月30日消息，乘聯會秘書長發布2024年5月全國充電樁市場分析。根據乘聯會整理的中國充電聯盟的數據分析，2024年5月的公樁數量較上月增長7.29萬個，快於去年同期增量23%；公樁年累增量32萬個，同比去年同期增速達到13%。隨車

06月30日 1903

OpenAI為什麼要封殺中國用戶，對我們影響有多大？ - 天天要聞

OpenAI為什麼要封殺中國用戶，對我們影響有多大？

本文首發於「單仁行」公號，訂閱「單仁行」公號從企業家的角度探究商業本質01從6月25日開始，越來越多的用戶收到了來自美國OpenAI的通知，在今年7月9日，OpenAI會阻止來自非支持國家和地區的API，也就是應用程序介面的服務。簡單點來說

06月30日 1956

拆解or自研？中國顯卡產業揭秘：7大理由告訴你為何不拆英偉達！ - 天天要聞

拆解or自研？中國顯卡產業揭秘：7大理由告訴你為何不拆英偉達！

科技時代，每次技術大突破都像是往平靜的湖面扔了個大石頭，水波蕩漾得不得了。可就在全球都盯著英偉達這科技大佬的頂尖顯卡技術時，中國卻偏偏不走尋常路——咱不拆英偉達顯卡，咱要自力更生，研發咱自己的國產顯卡！

06月30日 1447

阿里達摩院肯定知道姜萍事件真相，為什麼他們保持沉默？ - 天天要聞

阿里達摩院肯定知道姜萍事件真相，為什麼他們保持沉默？

這句話不是甩鍋，而是客觀事實，因為阿里達摩院不僅知道事情的真相，作為賽事組織者他們都有責任向公眾解釋清楚這件事的來龍去脈，不管事情是真是假都是這樣。

06月30日 1406

山西一高瓦斯煤礦瓦斯「憑空消失」原因？！ - 天天要聞

山西一高瓦斯煤礦瓦斯「憑空消失」原因？！

6月26日一早，國家礦山安全監察局山西局集中監察第五組來到山西省長治市沁源縣馬軍峪煤礦進行檢查。調取該礦90205綜采工作面迴風流瓦斯（甲烷）監控曲線圖，瓦斯濃度保持在0.1%至0.45%之間，平均濃度是0.3%。兩名監察員互相比了個「YE

06月30日 1915

華為新機昨日正式開賣，100元享北斗衛星消息，你心動了嗎？ - 天天要聞

華為新機昨日正式開賣，100元享北斗衛星消息，你心動了嗎？

華為驚爆新機！6月29日正式開賣，100元享北斗衛星消息，你心動了嗎？各位科技愛好者們，又到了激動人心的新機發布時刻！華為再次給我們帶來了驚喜。就在剛剛，華為官方突然宣布，備受期待的華為Pura70北斗衛星消息版正式開賣了！這款神秘新機終於

06月30日 1093

驚喜不斷：AMD 銳龍 9000X3D 系列處理器被曝將全面支持超頻 - 天天要聞

驚喜不斷：AMD 銳龍 9000X3D 系列處理器被曝將全面支持超頻

IT之家 6 月 29 日消息，AMD 近兩代推出的銳龍 X3D 處理器被視為市面上最佳遊戲處理器之一，在大部分網遊中都能有著接近甚至遠超旗艦 CPU 的性能，但這兩代 X3D 處理器都不支持官方超頻。Wccftech 報道稱，AMD Ryzen 9000X3D CPU 可提供全面的超頻支持，這也是 AMD 銳龍 X3D 晶元首次支持官方超頻。AMD 最初在

06月30日 5207

今年信創國產化替代迎來發力階段誠邁科技副總裁：國內信創產業生態圈仍要解決規模效應的痛點 - 天天要聞

今年信創國產化替代迎來發力階段誠邁科技副總裁：國內信創產業生態圈仍要解決規模效應的痛點

每經記者：胥帥每經編輯：楊夏隨著中國信創產業的蓬勃發展，自主創新和國產化替代的趨勢也在悄然興起。2027年作為信創產業的關鍵節點，預示著一個更加完善和強大的信息化標準體系即將形成。在這一背景下，國內信創產業的四大支柱——基礎硬體、基礎軟體、應用軟體和信息安全，正逐步構建起一個全新的生態系統。6月...

06月29日 8344