AI在「赚钱锦标赛」夺冠,比人类还会做生意!躺赚时代要来了? 下午4时 2025/05/25 作者 新智元 研究人员提出Vending-Bench模拟环境测试基于大模型的自动售货机管理能力,结果显示Claude 3.5 Sonnet表现最佳。实验还发现不同大模型在长时间运行中的表现差异较大。