突发,Grok-3免费上线!答对9.11和9.9谁大,1分攻克MIT积分难题

新智元报道 新世界首个20万块GPU训练出的Grok-3全部免费开放上线 DeepSearch和Think两大模式加持,Grok-3能秒解MIT积分赛题,但遭OpenAI研究员「打假」质疑作弊。它还支持高级语音模式,并能生成逼真的图像。

Claude挣钱强于o1!OpenAI开源百万美元编码基准,检验大模型钞能力

OpenAI 推出并开源 SWE-Lancer 基准测试,用于评估 AI 大模型在现实世界软件工程任务中的表现。包含 1400 多个自由软件工程任务,总价值 100 万美元。包括自家 GPT-4o、o1 和 Anthropic Claude 3.5 Sonnet 在内的前沿模型未能解决大多数任务,仅 Claude 3.5 Sonnet 拿到最高报酬 403,325 美元。

传言称Grok-3延迟!但马斯克仍手握最强算力

Grok-3因不符合要求而推迟发布,马斯克在AI竞赛中通过超强算力改写游戏规则。超级计算中心拥有20万块GPU,为了支持它建造了自己的天然气发电厂、部署了特斯拉电池以及安装了制冷系统。关于Grok-3的推理能力改进,工程师们正在添加新的功能以使其更强。不过也有质疑的声音认为拥有最多GPU并不意味着能做出最好的模型。