逐个token太慢!大模型原生并行出token,CMU、英伟达新作Multiverse
CMU Infini-Al-Lab 研究人员提出 Multiverse,一种支持原生并行生成的新型生成模型框架,显著提高大语言模型的推理效率和速度。
CMU Infini-Al-Lab 研究人员提出 Multiverse,一种支持原生并行生成的新型生成模型框架,显著提高大语言模型的推理效率和速度。
字节开源新型多模态生成模型Liquid,核心创新在于统一编码图像和文本到相同token空间,并使用单一LLM处理视觉理解和生成任务。研究表明,随着模型规模增大,性能下降会消失甚至互相促进。
论文提出的新模型ObjectMover结合视频扩散模型和虚幻引擎合成数据,实现了图像中物体的真实感移动。它不仅能处理物体的插入、删除和移动任务,还能有效保持物体的身份特征及光照效果。
华为诺亚决策推理实验室综述了生成模型在智能决策中的应用。文章介绍了七种主要的生成模型,并探讨了它们如何在机器人控制、结构优化、游戏 AI 和优化问题等领域中提升决策性能。