纯自回归图像生成模型开源来了,复旦联手字节seed共同捍卫自回归

基于Transformer的自回归视觉生成模型在图像生成领域的表现受到了质疑。然而,复旦大学和字节Seed的研究者们提出了一种新方法SimpleAR,在0.5B参数规模下实现了高质量图像的生成,并通过优化训练过程提升了模型的效果。

马斯克炫酷变身毒液!实测通义Wan2.1首尾帧视频模型,还能“拼接”经典梗图

阿里通义万相Wan2.1最新版发布,基于首尾帧技术能生成流畅、连贯的5s/720p视频。模型参数规模达到百亿级,支持在官网和多个开源平台使用。实测显示其表现优秀,具备较强的主体一致性、前后连贯性和细节把控能力。