“图片秒生”,腾讯混元图像2.0模型正式发布,主打速度和真实感
腾讯发布混元图像2.0模型,实现毫秒级响应速度和高生成质量,在GenEval评估中准确率达到95%。该模型支持实时绘画板功能,并即将推出原生多模态图像生成大模型。
腾讯发布混元图像2.0模型,实现毫秒级响应速度和高生成质量,在GenEval评估中准确率达到95%。该模型支持实时绘画板功能,并即将推出原生多模态图像生成大模型。
香港中文大学等团队提出Flow-GRPO,首个将在线强化学习引入流匹配模型的工作。显著提升图像生成模型在复杂场景理解、文本渲染任务上的性能,将SD3.5 Medium准确率从63%提升至95%,组合式生图能力超越GPT-4。
DeepSeek通过Janus-Pro和DeepSeek-VL等多模态模型在GenEval基准测试中表现出色,并提出解决细粒度视觉识别能力缺失的解决方案。它采用了数据原子化、知识蒸馏、动态注意力机制以及可控生成引擎等技术手段,推动了多模态学习范式的系统性变革。