Sakana AI 归档 - 每时AI

7B小模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLMTransformer作者团队

2025年6月27日14时作者机器学习算法与自然语言处理

MLNLP社区是国内外知名的人工智能社区，专注于推动自然语言处理与机器学习的学术交流和技术进步。Sakana AI提出的新方法通过教师模型输出清晰解释来训练学生模型，显著提高了效率。

7B小模型也能教出强推理AI

2025年6月26日8时作者 NLP工程化

Sakana AI提出的新方法RLT让7B模型训练出的学生超过671B模型，且成本仅为传统方法的1/3。

7B小模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLM Transformer作者团队

2025年6月24日23时作者量子位

Sanaka AI提出的新方法通过让教师模型输出清晰解释来改进教学效果，其7B小模型在传授推理技能方面超越了671B的DeepSeek-R1。这种方法不仅有效还经济高效，并且能与传统强化学习技术结合使用。

大模型玩不好数独？！Transformer作者初创公司公布排行榜：o3 Mini High“变异数独”正确率仅2.9%

2025年5月28日16时作者量子位

大模型在全新数独基准Sudoku-Bench上的表现不尽如人意，总体正确率低于15%，即使是高性能模型也仅能取得2.9%的正确率。研究团队认为这反映了现有基准测试的问题：大模型容易依赖记忆而非逻辑推理。Sakana AI推出的新基准挑战了这一点，包含复杂且需要多步骤推理的变异数独谜题，展示了AI在创造性和多层次推理上的局限性。