跳至内容
每时AI
菜单
菜单
资讯
国际
分享
大模型
学术
开源
机器人
关于我们
ToRL
自动学会工具解题,RL扩展催化奥数能力激增17%
下午11时 2025/04/01
作者
机器之心
用工具方面还存在一些局限,比如预先确定了工具的使用模式、限制了对最优策略的探索、实现透明度不足等。