Agent Laboratory接受人类研究想法和一组笔记作为输入,将其提供给一系列由LLM驱动的专门Agent组成的流程线,并产生研究报告和代码仓库。
-
由o1-preview驱动的Agent Laboratory产生了最佳的研究成果;
-
生成的机器学习代码能够与现有方法相比达到最先进的性能; -
人类的参与,即在每个阶段提供反馈,显著提高了研究的整体质量 -
自动化评估,按顶会NeurIPS标准,论文(6.1/10)接近了顶会NeurIPS接受论文的平均得分(5.9/10) -
而人类评估论文得分只有3.8/10,和自动化评估之间出现了一定差距
-
在协作模式(人类指导)下评估Agent Laboratory,评分由3.8提升到4.38(+0.58,NeurIPS接受论文的平均得分是5.9)。自选主题在实用性(+0.5)、继续使用(+0.5)和满意度(+0.25)方面普遍获得了更高的评分。
-
Agent Laboratory显著降低了研究费用,与之前的自主研究方法相比,实现了84%的减少。
-
文献综述 -
实验, -
报告撰写
https://github.com/SamuelSchmidgall/AgentLaboratory
https://agentlaboratory.github.io/
https://arxiv.org/pdf/2501.04227
(文:PaperAgent)