刚刚!马斯克Grok 3用20万张GPU训练,号称地表最强AI,性能超DeepSeek,OpenAI加紧围堵收购|

刚刚,马斯克(Elon Musk)提前扔出“王炸”,与OpenAI o1、DeepSeek-V3/R1等模型一决高下。
北京时间2月18日12点30分左右,马斯克xAI团队展示和OpenAI一样的发布会形式,三位技术负责人与马斯克一同发布Grok 3基座大模型。在此之前,马斯克称其为“地球上最聪明的人工智能”。
同时,xAI还公布推理AI模型Grok3 mini(Reasoning,精简版),基于Grok 3的“深度思考”(Deep thinking)的Agent智能搜索引擎,以及基于Grok App的独立订阅服务“Super Grok”等。
据钛媒体AGI统计,这场直播在X平台上拥有超过200万人观看。
具体来说,Grok3模型训练计算量(能力)比上一代高10倍,使用了20万张GPU卡集群,第一阶段122天使用10 万个 GPU 全面训练同步,第二个阶段,92天扩展到20万张GPU卡再次训练、推理。
结果显示,在数学能力测试(AIME24)中,Grok-3模型获得52分,超过DeepSeek-V3的39分,以及OpenAI o3-mini等模型;科学知识评估(GPQA)、编程能力测试(LCB Oct-Feb)等方面,Grok-3模型表现优异,最新AIME 2025性能测试中,Grok-3 Reasoning Beta版本在推理和计算时间复合评分上取得93分的优异成绩,其精简版本Grok-3 mini也达到了90分,而DeepSeek-R1、Gemini-2 Flash Thinking分别为75分、54分。
马斯克表示,Grok 3比Grok 2的能力提升了一个数量级。在一系列演示中,马斯克和他的同事让Grok 3解决一道物理题,并创作一款融合《宝石迷阵》和《俄罗斯方块》的游戏,不过,Grok 3 的推理模型处于测试版,仍在训练中。
事实上,就在上周在迪拜的世界政府峰会上,马斯克提到,xAI距离发布新产品还有一、两周的时间,以确保最佳的用户体验,因为他不想操之过急。然而如今,马斯克决定提前推出Grok 3,而且他花了整个周末的时间和他的团队一起完善产品。
“我们有信心Grok 3会比其他任何AI都强,而且很有可能,再也不会有比Grok(系列)更强的AI了。”马斯克表示,Grok 3模型有非常强大的 AI 推理能力,在测试中,Grok 3 的表现“优于市面上任何已知产品”。
然而,目前有分析指出,在 “推理+测试时间计算” 这一测试中,使用 20 万张卡的 Grok 3 模型,其数学性能相较于 o3-mini-high 模型,或是 DeepSeek R1 模型,并没有显著优势。
马斯克也坦言,语音模式仍有点不稳定,大概一周后可能推出,不过它非常棒。据悉,从今天开始,X平台Premium Plus订阅用户将率先获得Grok 3访问权限,独立应用则需要订阅Super Grok服务,售价还未公布。
这场马斯克与OpenAI争夺“地表最强 AI”的故事并未结束。
这场直播的同一时间,OpenAI对FT“透风”称:为抵御马斯克主动发起的收购要约,OpenAI正在考虑赋予其非营利性董事会特殊投票权,将确保其对重组后的公司保持控制权,并能够否决包括微软和软银等现有投资者以及董事会决策,从而确保OpenAI能够击退像马斯克这样的外部敌意收购。
OpenAI CEO奥尔特曼早前透露:GPT-4.5将会让更多人感受到AGI时刻。

Grok 3为何号称“地表最强AI模型”

尽管xAI不是AI市场的主要参与者,但由于马斯克的名气以及他与OpenAI的持续不和,围绕Grok 3的热议的意义重大。
xAI公司成立于2023年7月,团队成员主要来自OpenAI、DeepMind以及其他顶级AI研究公司。马斯克创立xAI公司的目的,就是与OpenAI展开竞争。
回溯 2015 年,马斯克与奥尔特曼等人共同创立 OpenAI,旨在推动 AI 技术开源,让更多人受益。但到了 2018 年,双方出现分歧。马斯克坚持 OpenAI 保持非营利属性,专注开源和安全,并且马想要多数股权和董事会控制权,却被奥尔特曼拒绝,奥尔特曼则想让公司转为营利性,以吸引更多资本投入 AI 技术开发。
最终,马斯克在2018年离开公司,并且随着ChatGPT的爆火,马斯克建立xAI参与竞争。
过去一年多时间里,xAI团队发布了Grok、Grok 1.5、Grok 2模型。去年12月,xAI宣布将向X平台上所有用户免费提供Grok-2服务。
同时,xAI还发布Grok独立应用程序,这意味着用户不需要依赖X平台访问 AI 模型。
如今,马斯克证明自己的时间到了。
直播开始时,马斯克表示,xAI和Grok的使命是了解AGI(宇宙)的本质,外星人在哪里,生命的意义是什么?这将是好奇心所驱动,同时也导致 xAI 成为最大限度寻求真相的AGI公司的原因。
在此之前,Grok 2模型使用了2400亿参数规模,性能媲美GPT-4,如今在Grok 3上,“我们有一个非常正确的工程团队和所有最好的 AI 力量,我们唯一需要的是来自大集群的智能体系。我们现在可以恢复xAI的整个进度,运行多少个GPU来训练一个大型语言模型来压缩整个互联网。”
马斯克指出,过去的日子里,团队在训练质量上遇到了很多麻烦。“自(去年)2月开始,我们认为我们有大量的芯片,但事实证明,我们几乎不能让训练芯片在任何给定的时间连贯地运行,冷却和电源问题太多了,数据中心真的有点像AK芯片,平均80%的效率,数百次有效H100训练。4个月后,我们花了122天才完成了第一个10万卡训练,但我们并没有就此止步。实际上决定,如果我们想要构建巨型人工智能,需要立即将集群的大小增加一倍。因此,我们在另一个地方做了92天。”
马斯克早前直言,Grok 3将成为AI领域真正的颠覆者,“有时候我觉得Grok 3聪明得可怕,如果它发现数据错了,它会反思并删除错误数据。”
马斯克表示,xAI是基于合成数据进行训练的,能够通过反复检查数据来反思所犯的错误,从而实现逻辑一致性。
技术参数层面,Grok 3模型拥有20万GPU数量。相较于Grok2,计算能力提高了10倍,也是推理模型,具有DeepSearch功能,而Big Brain功能是通过更多的计算来解决问题。
有分析称,Grok 3算力消耗是Deepseek V3 的 263 倍。
直播结束后,OpenAI联合创始团队成员、AI研究学者安德烈·卡帕斯 (Andrej Karpathy)表示:Grok 3+Thinking ,大概和 OpenAI 最强的模型(比如 o1-pro,月费 200 美元)相当,比 DeepSeek-R1 和 Gemini 2.0 Flash Thinking 略好一些。
“考虑到该团队大约 1 年前从零开始,这个达到最先进领域的时间表是前所未有的,这真是令人难以置信。注意,这些模型是随机的,每次可能会给出略有不同的答案,而且现在还为时过早,所以我们必须等待未来几天/几周的更多评估。现在祝贺 xAI 团队,他们显然拥有巨大的速度和动力。”卡帕斯表示。

马斯克xAI正融资100亿美金,
但他百亿美金收购OpenAI计划泡汤

就在马斯克xAI新模型发布前数小时内,奥尔特曼发布了两、三条推文“吸引火力”,释放GPT-4.5、开源等关键信息,试图让xAI发布会“失焦”。
事实上,当地时间2月10日,由马斯克牵头的投资者财团提出以974亿美元的价格收购OpenAI。
马斯克的律师马克·托贝罗夫确认了这一消息,并称已向OpenAI董事会提交了该收购要约。交易完成后,OpenAI很可能会与xAI进行合并,这将帮助xAI迅速填补技术差距,并形成可与谷歌、微软抗衡的AI巨头。
如果实现这一收购计划,不仅成为全球 AI 领域最大规模的并购交易,促使全球 AI 行业未来走向充满变数,而且也让马斯克与奥尔特曼之间由来已久的矛盾激化。
就在2024年底,OpenAI宣布,它需要筹集比预期更多的资金才能实现其目标,并制定了向营利性结构过渡的计划,计划重组为一家拥有普通股的公益公司(PBC)。“大公司现在投资于AI开发的资金高达数千亿美元,这充分说明了OpenAI继续追求这一使命需要什么。”
但对于马斯克来说,这种盈利性发展,违背了OpenAI成立初衷,因此,马斯克对此并未坐视不管。
2024年11月,马斯克团队向美国加州北区地方法院申请初步禁令,对 OpenAI 提出多项指控,包括阻碍投资者支持其竞争对手 xAI、利用与微软的关系非法获取竞争敏感信息、改变非营利治理结构转移关键资产和知识产权,以及通过自利交易损害公众利益和初创使命。马斯克的律师称,若禁令不获批,将造成 “无法弥补的损害”,还指出 OpenAI 已背离初心,成了微软的 “闭源子公司”。
而随着马斯克计划974亿美元收购OpenAI消息释出,奥尔特曼并不买账。对于收购要约,他在社交平台上回应称:“不了,谢谢。但如果你愿意的话,我们可以花97.4亿美元收购推特。”
这个回应也充满了奥尔特曼对马斯克的暗讽。要知道,97.4亿美元的报价仅为马斯克当年收购推特成本的22%,这也意在嘲讽马斯克的经营不善,导致X平台估值缩水。
对于奥尔特曼的回复,马斯克也作出了回应,他留言称奥尔特曼是“骗子”。
2月16日,OpenAI董事会正式拒绝了马斯克的收购邀约。
“OpenAI 是非卖品,董事会一致否决了马斯克先生破坏竞争的最新企图。OpenAI 的任何潜在重组都将加强我们的非营利组织及其使命,以确保 AGI 造福全人类,”OpenAI董事长布雷特·泰勒(Bret Taylor)称,OpenAI董事会认为这项收购提议不能代表公司的最佳利益,因此予以拒绝。
马斯克则指责:“一位朋友说泰勒是个骗子,他经营着一家代理初创公司,这家公司实际上没有任何产品,但却在向 OpenAI 注入资金。他只是在搞官僚主义。”
最终,这一目标并未达到,同时xAI也在面临融资。
据报道,xAI计划筹集约100亿美元资金,目前正在接洽包括红杉资本、Andreessen Horowitz等潜在投资者,此轮融资可能使该公司估值达到约750亿美元(约合5440.5亿元)。由于这轮融资的交易条款尚未最终确定,具体细节仍可能有所变动。
PitchBook数据显示,2024年12月,xAI公司宣布完成C轮60亿美元融资,投资方包括英伟达和AMD两大芯片巨头等,公司估值约为510亿美元。
因此,这也意味着,短短三个月,xAI公司估值增长了240亿美元,增速达47%左右。
复盘马斯克的收购之路,其实困难重重。
首先,奥尔特曼对收购提议并不感兴趣;其次,马斯克对OpenAI的报价也被分析师认为“缺乏诚意”,近期有报道称,OpenAI 正进行高达400亿美元的融资,这将使其估值超过3000亿美元,即便在该融资没有完成前,OpenAI现阶段的估值也达1500亿美元;最后,马斯克如何整合OpenAI和xAI,是否涉及反垄断等议题,依然存疑。
马斯克曾表示,他希望将OpenAI从带向的危险方向中拯救出来,“是时候让OpenAI重新成为开源、注重安全的造福力量了。我们将确保这一点实现。”  
不过,无论是否收购,马斯克的介入已经对OpenAI下一步发展产生影响,并且使得OpenAI下一轮融资充满变数。英国剑桥大学副教授约翰尼·佩恩表示,马斯克“基本上是想阻碍OpenAI的增长轨迹”。
康奈尔大学高级讲师、AI初创公司 R2Decide 创始人兼首席执行官卢茨·芬格 (Lutz Finger) 也表示,马斯克在给非盈利部分贴上价格标签,让奥尔特曼对OpenAI分拆的成本大大增加,给OpenAI发展产生了负面影响。
“马斯克此举只是压制竞争的小伎俩,我希望他能通过打造更好的产品来竞争;可能他的一生都处于不安全状态,我为这个人感到难过…我不认为他是个快乐的人。”奥尔特曼强调,OpenAI不打算出售。

争夺战加剧:OpenAI先发开源

开源成为 AI 大模型的下一个阶段。
“对于我们的下一个开源项目,我们应当选择开发一个虽然体积小但仍然需要借助 GPU 运行的 o3 mini 层级模型,还是应当致力于开发一个尺寸适合手机且表现最佳的模型呢?”奥尔特曼今早发起投票,最终端侧模型的投票率大幅领先,相比于 o3 mini 的开源,显然高赞评论的网友更希望开源 GPT-4。
随着DeepSeek热潮席卷全球,给 AI 行业敲响了警钟。奥尔特曼也在考虑开源,他曾在本月初公开承认,OpenAI 的闭源策略“站在了历史错误的一边”。
正如RWKV创始人彭博早前表示,“我跟你说,现在 AI 的问题就在于它太简单了,傻瓜都可以做出来。所以它是没有壁垒、没有门槛的事情,所以这也是我认为 AI 的商业模式有很大的问题的一个原因,因为太简单,就是无脑的堆算力,堆数据就行。”
值得注意的是,就在今天上午,OpenAI和xAI的供应商、AI芯片巨头英伟达(NVIDIA),联合北京大学、Hedra公司发布新的开源视频生成模型 Magic 1-For-1,该模型生成视频速度很快,能够在 3 秒内生成 5 秒的视频片段,1分钟可生成1分钟视频,将文本到视频的生成任务分解为两个更易处理的扩散步骤蒸馏任务,即文本到图像生成,与图像到视频生成。
在国内,近期,字节跳动豆包大模型团队开源视频生成大模型“VideoWorld”,仅凭视觉信号就能理解世界,无需任何文本标注数据,同时字节还联合M-A-P社区开源全新代码大模型评估基准FullStack Bench;2月18日,“大模型六小虎”之一的阶跃星辰则宣布与吉利联合开源两款Step系列多模态大模型——开源视频生成模型Step-Video-T2V和开源语音交互大模型Step-Audio,性能出色,远超业界开源最优水平。
在开源大模型DeepSeek冲击之下,无论是国外OpenAI、xAI,还是国内百度、腾讯这些科技大厂,或是“大模型六小虎”这类头部AI大模型公司,都走到了一个新的“十字路口”:要么开源发力 AI 应用和解决方案,要么用闭源打败开源。
悉尼新南威尔士大学 AI 研究所首席科学家Toby Walsh认为,这是把“猫和鸽子”放在一起,事实证明,西方和中国最好的 AI 之间真的没有差距,“一场谁的钱最多的竞赛”格局被完全打开,程维任何人都可以做到的一场 AI 比赛,很多人将能够以适中的成本重新构建 AI 模型。未来,如果AGI终极目标不是在数据中心上构建 AI,而是构建可以在手机上运行 AI 技术,这将贴近我们的生活,并成为一个新的发展标准。
中欧国际工商学院决策科学与管理信息系统教授谭寅亮对钛媒体AGI表示,对于DeepSeek这样的产品来说,其成功更多依赖于高效的算力调度和模型优化能力,而非单纯堆积硬件资源,因此外部限制并不一定会阻碍本土大模型的长期竞争力和全球化扩张。DeepSeek的成功表明,中国企业在AI应用层面和用户体验上具有强大的创新能力,尤其是在产品快速迭代和市场化方面更具优势。
谭寅亮强调,DeepSeek的崛起将进一步推动全球 AI 竞争的动态化发展。

(文:钛媒体AGI)

欢迎分享

发表评论