312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7

上海交通大学和SII的研究表明,仅需312条人类标注轨迹,并通过合成更多动作决策的思维链补全与轨迹增强技术,就能显著提升电脑智能体(Operator)性能。这一方法使得模型性能提升了241%,超越了基础模型Claude 3.7 Sonnet extended thinking模式,成为Windows系统上开源电脑智能体的新一代SOTA。

想并肩 DeepSeek 不能靠自嗨和邀请码

Manus 是一个由中国团队开发的 AI Agent 产品,它可以在虚拟环境中调用各种工具完成复杂任务。虽然其功能类似其他已有的 AI Agent,但因其封闭的邀请码机制和社交传播效果显著,在AI圈内迅速流行。然而,与 DeepSeek 相比,Manus 的成功更多依赖于营销策略而非技术实力。

奥特曼首次承认 DeepSeek 削弱 OpenAI 优势:我们可能站在了历史错误的一边

Sam Altman 在 OpenAI 的问答活动中表示,OpenAI 目前的重点是优化 Operator,并推出语音模式更新,而非立即追求开源策略。他提到递归自我提升可能很快实现,但 AGI 模型的加速科学发现可能是最大的影响。