异步生成归档

策略学习助力LLM推理效率：MIT与谷歌团队提出异步并行生成新范式

下午4时 2025/05/21 作者机器之心

金天和郑鈺熹是麻省理工学院的博士生，他们研究了大语言模型生成范式的转变。PASTA 论文介绍了通过策略学习实现异步生成的方法，包括标记语言 PASTA-LANG 和优化训练流程。实验结果表明这种方法能显著提高推理速度并保持输出质量。