AI推演OpenAI内斗结果:奥特曼仅有20%胜率,马斯克也有机会接盘???

AI公司Fable模拟奥特曼5天被罢免后重返OpenAICEO职位的过程,在20场模拟中仅成功4次。其中Ilya赢的次数与奥特曼相当,马斯克也曾接盘。Fable CEO Edward Saatchi认为这是测试决策模型的好方法,强调个性在游戏中的重要性。

限定120分钟科研挑战,o1和Claude表现超越人类

人类VS AI的科研能力大比拼:基于Claude 3.5 Sonnet和o1-preview构建的智能体2小时内表现远超人类专家,但随着时间增加,人类专家的表现更为显著。研究显示AI更适合处理大量并行的短期任务,而人类更适应复杂长时间的研究。