GPT-4o最自私,Claude更慷慨!DeepMind发布全新「AI道德测试」

新智元报道
编辑:LRS
研究者通过对智能体在捐赠者游戏中的表现,分析了Claude 3.5、Gemini 1.5 Flash和GPT-4o等模型的合作行为差异。结果显示,Claude 3.5表现出更有效的合作和惩罚搭便车行为的能力,而GPT-4o则更自私。未来人机协同社会中需要考虑不同LLM智能体的道德和行为差异。