金牌选手惨败!Google DeepMind 最新推出AlphaGeometry2 碾压国际奥数冠军

Google DeepMind最新推出的AlphaGeometry2(AG2)在国际数学奥林匹克竞赛中表现出色,解题覆盖率从66%提高至88%,超越了往年IMO金牌得主平均水平。AG2具备四大超能力:语言系统升级、特种部队式搜索算法、推理引擎速度提升及3亿定理训练。未来或将颠覆传统奥数考场。

科研党狂喜!AI预测神经学研究结论超过人类专家水平 Nature子刊

神经学研究专用基准BrainBench显示,经过训练的LLM预测结果准确率为81.4%,远超人类专家的63%。论文提出了一个新基准测试,评估LLM预测神经科学结果的能力,并发现LLMs学习了广泛的科学模式而不是记忆数据。