限定120分钟科研挑战,o1和Claude表现超越人类

人类VS AI的科研能力大比拼:基于Claude 3.5 Sonnet和o1-preview构建的智能体2小时内表现远超人类专家,但随着时间增加,人类专家的表现更为显著。研究显示AI更适合处理大量并行的短期任务,而人类更适应复杂长时间的研究。