信息增益归档 - 每时AI

AAAI 2025 武大团队提出SEAM框架：「强赋能弱监管」的弱到强泛化

下午11时 2025/03/16 作者 PaperWeekly

Background
在开始介绍我们的论文前，先简要介绍一下：
1
）什么是
super-alig

如何优化测试时计算？解决「元强化学习」问题

下午4时 2025/02/10 作者机器之心

化大模型的
测试时计算
是提升模型部署效率和节省计算资源的关键一环。前段时间，黄仁勋在 CES 20