字节图像生成新模型:主打多主体一致性,新基准数据集同时亮相

字节发布多主体控制生成模型Xverse,可以精确控制多个主体的身份和语义属性。该模型包括T-Mod适配器、文本流调制机制、VAE编码图像特征模块及正则化技术等关键部分,并通过XVerseBench基准测试验证其效果。

李飞飞团队提出架构设计新思路!无需从头训练,直接“嫁接”预训练模型关键组件

研究人员提出了一种‘嫁接’新思路——直接将预训练好的模型作为‘底座’,通过修改组件来研究新架构。这种方法在不增加大量计算资源的情况下提高了文生图模型的生成速度,并且保持了较好的图像质量。