逐个token太慢!大模型原生并行出token,CMU、英伟达新作Multiverse 2025年6月17日23时 作者 机器之心 CMU Infini-Al-Lab 研究人员提出 Multiverse,一种支持原生并行生成的新型生成模型框架,显著提高大语言模型的推理效率和速度。