仅1k样本超越o1,媲美DeepSeek-R1蒸馏模型,李飞飞新作s1发布 下午7时 2025/02/06 作者 PaperAgent 一种新的语言建模方法Test-time Scaling通过测试时增加额外计算来提升性能,作者李飞飞等新作S1提出了一种简单而有效的测试时扩展方法,并展示了其实用性。