MangaZero归档 - 每时AI

CVPR 2025｜北大开源多模态驱动的定制化漫画生成框架DiffSensei，还有4.3万页漫画数据集

2025年3月7日16时作者机器之心

DiffSensei 是首个结合多模态大语言模型（MLLM）与扩散模型的定制化漫画生成框架，通过创新机制实现角色控制、布局精准及动态叙事。该框架支持从文本到漫画的高效转换，并发布首个专为漫画生成设计的数据集MangaZero，提升角色一致性、文本跟随能力和图像质量。