CSAIL 归档 - 每时AI

策略学习助力LLM推理效率：MIT与谷歌团队提出异步并行生成新范式

2025年5月21日16时作者机器之心

金天和郑鈺熹是麻省理工学院的博士生，他们研究了大语言模型生成范式的转变。PASTA 论文介绍了通过策略学习实现异步生成的方法，包括标记语言 PASTA-LANG 和优化训练流程。实验结果表明这种方法能显著提高推理速度并保持输出质量。

2025年4月28日16时作者量子位

让大模型玩井字棋成为新的热门挑战，引发广泛关注。不同模型对战结果各异，OpenAI的o3甚至能看图下棋取胜。对比了几种方式后发现，模型在应对复杂局面时仍需改进。

2024年12月20日18时作者新智元

新智元报道
编辑：编辑部 HYZh
【新智元导读】
英伟达2025年博士奖学金名单揭晓了！今年，共有