MCTS
Awesome-Slow-Reason-System:深度探索慢思考推理系统的前沿进展与实践
Awesome-Slow-Reason-System介绍了一种慢思考推理系统的前沿进展与实践,涵盖了50多篇最新研究成果,涉及多种技术如MCTS、RL等,并提供复现资源。
重大突破!微软发布“自我进化”,帮小模型超OpenAI-o1
Microsoft亚洲研究院发布的rStar-Math通过代码增强CoT、蒙特卡洛树搜索等方法提升小模型数学推理能力,平均在AIME 2024测试中解决了53.3%的难题,并显著提升了多个数学基准测试的表现。