科研也完了,AI暴虐170位人类专家!Nature子刊:大模型精准预测研究结果,准确率高达81%
新智元报道,大型语言模型在神经科学领域的预测任务中表现优于人类专家,平均准确率为81%,而人类仅为63%。研究人员开发的BrainBench基准测试了模型和人类专家的表现。
新智元报道,大型语言模型在神经科学领域的预测任务中表现优于人类专家,平均准确率为81%,而人类仅为63%。研究人员开发的BrainBench基准测试了模型和人类专家的表现。
神经学研究专用基准BrainBench显示,经过训练的LLM预测结果准确率为81.4%,远超人类专家的63%。论文提出了一个新基准测试,评估LLM预测神经科学结果的能力,并发现LLMs学习了广泛的科学模式而不是记忆数据。