100万美元归档

速递｜Anthropic首次战略投资：Goodfire获5000万美元A轮融资，押注AI“黑箱解码”

下午4时 2025/04/19 作者 Z Potentials

Anthropic投资初创公司Goodfire，后者致力于帮助AI开发者理解其模型内部机制。这笔5000万美元融资中的一部分来自Menlo Ventures领投，估值2.5亿美元。

【一周连连看】高途陈向东站台吴彦祖英语课，AI玩具狂飙“600亿规模”！

下午11时 2025/03/16 作者多知

枝丫上的花苞又再说春天已经到来。
本周的教育科技行业，依然保持着勃勃生机。
在本篇中你将看到：
1、

OpenAI推出的AI基准测试，却让Claude拿了第一名？！

下午2时 2025/02/21 作者 AI信息Gap

OpenAI 推出 SWE-Lancer 基准测试，评估 AI 模型在真实软件工程任务中的表现，涵盖独立开发和管理任务，涉及多种类型和复杂度的软件开发任务。

OpenAI推出真实世界百万报酬AI编程能力测试基准：实测Claude 3.5 最强！

下午12时 2025/02/19 作者 AI寒武纪

OpenAI联合一众大佬发布SWE-Lancer，一个评估前沿LLM在真实软件工程任务中的基准测试。它从Upwork精选了超过1400个真实的软件工程任务，总价值高达100万美元。SWE-Lancer包含个人贡献者和技术领导者的两种类型的任务，采用端到端测试模拟真实环境。研究结果显示模型表现仍有提升空间，OpenAI开源了数据集以促进更多研究。