科研党狂喜!AI预测神经学研究结论超过人类专家水平 Nature子刊
神经学研究专用基准BrainBench显示,经过训练的LLM预测结果准确率为81.4%,远超人类专家的63%。论文提出了一个新基准测试,评估LLM预测神经科学结果的能力,并发现LLMs学习了广泛的科学模式而不是记忆数据。
神经学研究专用基准BrainBench显示,经过训练的LLM预测结果准确率为81.4%,远超人类专家的63%。论文提出了一个新基准测试,评估LLM预测神经科学结果的能力,并发现LLMs学习了广泛的科学模式而不是记忆数据。
牛津大学提出Kinetix框架,训练通用RL智能体在2D物理环境中执行多样化任务,涵盖机器人任务、经典RL环境等。通过Jax2D硬件加速引擎模拟数十亿次交互生成多样任务。研究发现微调使通用智能体能显著减少特定任务学习所需样本数,并带来新能力。