单提示生成「主体一致」图像,且无需训练!已斩获ICLR 2025 Spotlight

南开大学等机构提出的新方法1Prompt1Story无需额外训练即可实现人物形象一致的文图生成,通过整合多个提示、奇异值重加权和身份保持交叉注意力技术,解决了现有方法存在的问题。

必看!VividTalk:阿里、南大等联合打造,一张照片+音频秒变说话头像视频黑科技

VividTalk是南京大学、阿里巴巴、字节跳动和南开大学联合开发的人工智能技术项目,通过音频驱动生成逼真的说话头像视频。该项目采用先进的3D混合先验技术和双分支运动-VAE(变分自编码器)来实现高质量的视觉效果和自然同步对话。