208,050美元归档

OpenAI掀「百万美金」编程大战！Claude 3.5 Sonnet狂赚40万拿下第一

下午4时 2025/02/19 作者新智元

OpenAI发布SWE-Lancer基准测试，评估AI模型在现实任务中的编码能力。Anthropic的Claude 3.5 Sonnet表现最佳，挣得403,325美元报酬，远超GPT-4o和o1模型。