帮助归档 - 每时AI

「不思考」反而更强？上海AI Lab重新定义视觉强化学习微调最优路径

下午4时 2025/05/08 作者 PaperWeekly

且在一些模型上取得了优于监督微调（SFT）的成果。
RFT 利用可验证的奖励进行训练，鼓励模型在回答

“开源版coze”爆火，融资超 4.6 亿！如今 Docker 拉取量超 1 亿，斩获 77.5k star

下午11时 2025/04/12 作者 AI前线

pe 领投，HV Capital 以及之前的投资者 Sequoia、Felicis 和 Harpoo

Nature子刊发表北理工团队通过类鼠机器人调控大鼠情绪状态推动生物混合系统研究

下午2时 2024/12/11 作者机器人大讲堂

在生物学的研究理论当中，生物混合系统是当今研究的热点话题，除脑机接口这种前沿领域外，人与动物之间的无

“云计算一哥”一口气发布6个大模型、3nm芯片！多模态还要搞Any-to-Any

下午3时 2024/12/04 作者量子位

金磊发自拉斯维加斯
量子位 | 公众号 QbitAI
就在刚刚，云计算一哥
亚马逊云科技
，在大