AutoStudio - AI 漫画生成器
AutoStudio 是一个用于多轮交互图像生成的无训练多代理框架。这个项目的目的是在用户多次互动时,生成一致且高质量的图像序列。
AutoStudio 由中山大学深圳校区和联想研究院联合发布。
AutoStudio 包含以下四个主要组件:
主题管理器:负责解释交互对话并管理每个主题的上下文。
布局生成器:生成细粒度的边界框以控制主题的位置。
监督者:提供布局优化建议。
绘图者:完成图像生成。
此外,AutoStudio 引入了一个平行 UNet 来替代原始的 UNet,通过两个平行的交叉注意力模块来利用主题相关的特征,并采用主题初始化生成方法来更好地保留小主题。
实验结果表明,AutoStudio 在保持多主题一致性方面表现出色,并在 CMIGBench 基准测试和人类评估中显著提高了最新技术的表现。具体表现为平均弗里歇特嵌入距离提高了13.65%,平均字符-字符相似性提高了2.83%。
官方网址:https://howe183.github.io/AutoStudio.io/
项目地址:https://github.com/donahowe/AutoStudio
论文地址:https://arxiv.org/pdf/2406.01388
本文采用署名-非商业性使用-相同方式共享 4.0 国际许可协议[CC BY-NC-SA]进行授权 | 作者:CodeF
文章固定链接:https://www.codef.cc/autostudio-ai.html
本站资源仅供个人学习交流,请于下载后 24 小时内删除,不允许用于商业用途,否则法律问题自行承担。
本站软件默认解压密码均为:CodeF.cc
文章固定链接:https://www.codef.cc/autostudio-ai.html
本站资源仅供个人学习交流,请于下载后 24 小时内删除,不允许用于商业用途,否则法律问题自行承担。
本站软件默认解压密码均为:CodeF.cc
THE END