策略学习助力LLM推理效率:MIT与谷歌团队提出异步并行生成新范式

金天和郑鈺熹是麻省理工学院的博士生,他们研究了大语言模型生成范式的转变。PASTA 论文介绍了通过策略学习实现异步生成的方法,包括标记语言 PASTA-LANG 和优化训练流程。实验结果表明这种方法能显著提高推理速度并保持输出质量。

2025英伟达奖学金名单公布,7位华人入选!中科大浙大校友在列,人均6万美元

新智元报道
编辑:编辑部 HYZh
【新智元导读】
英伟达2025年博士奖学金名单揭晓了!今年,共有