「不思考」反而更强?上海AI Lab重新定义视觉强化学习微调最优路径 下午4时 2025/05/08 作者 PaperWeekly 且在一些模型上取得了优于监督微调(SFT)的成果。 RFT 利用可验证的奖励进行训练,鼓励模型在回答
“开源版coze”爆火,融资超 4.6 亿!如今 Docker 拉取量超 1 亿,斩获 77.5k star 下午11时 2025/04/12 作者 AI前线 pe 领投,HV Capital 以及之前的投资者 Sequoia、Felicis 和 Harpoo
Nature子刊发表 北理工团队通过类鼠机器人调控大鼠情绪状态 推动生物混合系统研究 下午2时 2024/12/11 作者 机器人大讲堂 在生物学的研究理论当中,生物混合系统是当今研究的热点话题,除脑机接口这种前沿领域外,人与动物之间的无
“云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any 下午3时 2024/12/04 作者 量子位 金磊 发自 拉斯维加斯 量子位 | 公众号 QbitAI 就在刚刚,云计算一哥 亚马逊云科技 ,在大