Post-Training Scaling Law归档

Now, Scaling What?

上午11时 2025/05/25 作者机器之心

机器之心PRO本周解读：自2024年起，Scaling范式开始转移。研究者从”预训练之后，What to Scale Now？”入手，探索新的Scaling目标。TTS（Test-Time Scaling）方法在推理阶段增加计算资源来增强模型性能成为关注热点。

扩展测试时计算是万能的吗？Scaling What成为关键

下午4时 2024/11/17 作者每时AI

近日，The Information 报道引发关于大模型 Scaling Laws 是否达到极限的争议。OpenAI 的新模型 Orion 相比 GPT-3 和 GPT-4 性能提升有限。业内认为传统 Scaling Laws 已经进入边际效应递减阶段，需关注扩大正确规模和优化推理时间。MIT 研究指出测试时训练在提高抽象推理任务上的性能有效。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30