姚顺雨归档 - 每时AI

大模型进入 RL 下半场，模型评估为什么重要？

下午4时 2025/05/13 作者 Founder Park

大模型评估重要性讨论，SuperCLUE发布中文通用AI智能体测评基准AgentCLUE-General。超级 CLUE 联合创始人朱雷分享大模型及 Agent 评估难题与企业落地建议。

下午11时 2025/05/09 作者 Founder Park

大模型评估重要性被热议，SuperCLUE推出中文通用AI智能体测评基准。

下午4时 2025/04/19 作者 AI寒武纪

、o‑系列模型已经把“智能”从棋盘和试卷一路卷到代码、创作甚至电脑屏幕背后的每一次点击
清华姚班出

下午11时 2025/04/17 作者量子位

姚顺雨指出AI发展分为上半场和下半场。上半场以模型和方法为主，而下半场的重点转向如何定义现实任务并有效评估AI的表现。他强调强化学习已能泛化，并提出新的评估规则来解决当前局限性。