大语言模型变身软体机器人设计「自然选择器」,GPT、Gemini、Grok争做最佳

研究团队开发RoboCrafter-QA基准测试评估大型语言模型在软体机器人设计中的能力,发现当前模型在简单设计选择上表现良好但处理细微权衡和复杂环境时仍面临挑战。