7B的DeepSeek蒸馏Qwen数学超o1!在测试时间强化学习,MIT积分题大赛考93分

DeepSeek研究团队发表LADDER论文,介绍一种通过递归问题分解和强化学习提升AI模型能力的新方法。该方法使7B规模的Qwen模型在MIT Integration Bee比赛中得分达到90分,超越了o1的成绩。

5个人三小时复刻开源版Manus,邀请码也不需要了

5人团队3小时完成开源复刻版OpenManus,展示了模块化Agent系统、实时反馈机制及强大工具链等关键要素。通过对比官方demo和开源成果,揭示了实现Manus的合理路径及其背后的三大核心技术:模块化Agent系统、透明思维过程以及协作工具集。