首款!能够实时生图的模型出现了
腾讯混元发布全新图片生成模型Hunyuan Image2.0,具备超快推理速度和超高质量图像生成能力,实现毫秒级出图且保持真实感。该模型可在实时对话中进行输入与输出同步处理,并提供实时绘画板功能辅助创作。
腾讯混元发布全新图片生成模型Hunyuan Image2.0,具备超快推理速度和超高质量图像生成能力,实现毫秒级出图且保持真实感。该模型可在实时对话中进行输入与输出同步处理,并提供实时绘画板功能辅助创作。
香港中文大学等团队提出Flow-GRPO,首个将在线强化学习引入流匹配模型的工作。显著提升图像生成模型在复杂场景理解、文本渲染任务上的性能,将SD3.5 Medium准确率从63%提升至95%,组合式生图能力超越GPT-4。
Adobe 发布Firefly AI平台新版本,新增翻译音频、视频功能及背景音乐生成能力,提升创意工作效率。支持多种语言翻译、声音与视频同步调整,并提供图像和视频生成模型,增强内容创作灵活性。
Google发布了全新的Veo 2视频生成模型和Imagen 3图像生成模型。测试结果显示,Veo 2在画面质量和提示词遵从度上都超越了OpenAI的Sora。此外,Imagen 3在文字渲染和细节呈现方面表现优异,创下了1115的新高分。Google已经在多个平台上推出这两款产品。
MAPLE实验室提出通过强化学习优化扩散模型和流匹配模型的多步去噪过程,实现用更少步骤生成高质量图像,并显著减少约50%推理步数。