首款!能够实时生图的模型出现了

腾讯混元发布全新图片生成模型Hunyuan Image2.0,具备超快推理速度和超高质量图像生成能力,实现毫秒级出图且保持真实感。该模型可在实时对话中进行输入与输出同步处理,并提供实时绘画板功能辅助创作。

首次!流匹配模型引入GRPO,GenEval几近满分,组合生图能力远超GPT-4o

香港中文大学等团队提出Flow-GRPO,首个将在线强化学习引入流匹配模型的工作。显著提升图像生成模型在复杂场景理解、文本渲染任务上的性能,将SD3.5 Medium准确率从63%提升至95%,组合式生图能力超越GPT-4。

Adobe 重新启动 Firefly,成为图像、视频、音频等一站式 AI 引擎

Adobe 发布Firefly AI平台新版本,新增翻译音频、视频功能及背景音乐生成能力,提升创意工作效率。支持多种语言翻译、声音与视频同步调整,并提供图像和视频生成模型,增强内容创作灵活性。

重磅:Google 推出图文视频生成双王!Sora要完了?

Google发布了全新的Veo 2视频生成模型和Imagen 3图像生成模型。测试结果显示,Veo 2在画面质量和提示词遵从度上都超越了OpenAI的Sora。此外,Imagen 3在文字渲染和细节呈现方面表现优异,创下了1115的新高分。Google已经在多个平台上推出这两款产品。