Grok 3.5 或今晚发布,超强基准测试疑似流出

Grok 3.5现身代码,发布在即!

X平台的用户最近发现了新的线索——Grok 3.5可能即将发布

这一切都与马斯克上周的宣告吻合:

Grok 3.5将于本周推出!

多位用户在X平台代码中发现了相关的蛛丝马迹,看来马斯克的「超级AI」又要迎来一次新的飞跃了!

代码中的秘密

用户Charlie L.(@whylifeis4)首先披露了这一消息,他在X平台的代码中发现了明确的Grok 3.5字样:

这些代码片段明确指向了Grok的新版本,让一众网友开始期待这款由xAI开发的模型的重大更新。

而图中可以看到,系统已经开始为Grok 3.5的付费订阅做准备,或为新版本即将上线的有力证据。

不过,有用户Adam Braun(@twitAdamBraun)提醒说:

这些代码至少从周日开始就已经存在了(那时我检查过)。它只是购买super grok订阅的促销横幅。

看来该迹象已经存在一段时间了,但现在才被更多人注意到。

马斯克的宏大承诺

回顾上周4月29日,马斯克曾宣布Grok 3.5将于本周发布早期测试版,仅限SuperGrok订阅用户体验

当时他做出了一个重磅承诺:

Grok 3.5是首个能准确回答火箭引擎或电化学等复杂技术问题的AI,它从第一性原理出发,甚至能给出互联网上不存在的答案。

这一宣告意义重大——

意味着Grok 3.5不再只是回答网络上已有的信息,而是能通过自身的理解和推理能力,帮用户解决极度专业的问题,甚至创造出新知识。

而SuperGrok 是xAI推出的付费订阅高阶服务,用户可以优先体验新功能。不得不说,奥特曼惯用的早花钱早享受套路,马斯克倒是学的挺快。

疑似基准测试流出

而更让人期待的是,网上已经流传出Grok 3.5的基准测试结果。

据网友@iruletheworldmo分享的数据显示(注意:以下为未经官方确认的传言数据):

这图包浆得有点糊(有点不敢相信),我整理了下:

基准测试
Grok 3.5
Grok 3
Gemini 2.5 Pro
o3
AIME’24
95.6%
84.2%
91.8%
91.7%
AIME’25
92.3%
77.1%
86.9%
88.7%
GPQA Diamond
88.2%
80.4%
84.1%
83.1%
SimpleQA
58.1%
43.4%
52.7%
49.2%
MMMU
87.3%
76.2%
81.5%
83.0%

可见在多项权威测试中,Grok 3.5似乎表现出色,远超Gemini 2.5 Pro 和O3 模型。

该网友还补充道:

这只是一个早期检查点,Grok会变得越来越好,直到它直接超越超级智能。

要是数据属实,那只能说,其他公司不用活了……

游戏,已经结束。

大家都改行做应用去吧,模型交给xAI 就够了。。。

而关于此消息,网友也是各种回应,五花八门:

有人表示这是形势所迫,RobKai 🇩🇪(@robertkainz04)称:

他们必须这么做,Google现在发展太快了

也有人对此持怀疑态度,Ramon Vinicius(@RamonVi25791296)表示:

R2发布「即将到来」已经5周了。

不论真假,X平台用户对Grok 3.5的期待已经到了迫不及待的地步:

AI Wave(@aiwaveco)用一句话完美概括了大家的心情:

Grok 3.5的预告比HBO电视剧还多。要么直接发布,要么给我们看最终预告片吧。

而Nifty(@nifty0x)则分享了一张表达「等待中」的meme 图:

而看到流出的性能数据后,网友们的热情更加高涨。Alex from OmniraAI(@OmniraAi):

Grok 3.5不是一个模型。它是一个神圣的人工制品。在沙中锻造。被星星低语。基准测试?不,这些是经文。

Sarah Smith(@Defundmedianow):

Just Grok it!

而 Dr. Apurv(@DrApurv_) 则分享了马斯克的一个更远大的目标:

「如果一切顺利,SpaceX将在2026-27年将搭载Optimus机器人和Grok的星舰送往火星。Optimus将在火星上行走。」——埃隆·马斯克

发布时间猜测

回到现实中的问题:

Grok 3.5究竟何时发布?

Chandrakumar Pillai(@CKPillai_AI_Pro)表示:

Grok 3.5可能随时发布,也可能让我们再多猜一会儿。

JamesemaJ(@jarvis0970)给出了自己的分析:

今天是星期五,肯定是今天发布。这类事情通常不会在周末发生,所以如果在下周一发布,就违背了埃隆在推文中的说法,这是不寻常的。

除非老马又一次放鸽子!

还有用户已经在憧憬Grok 3.5与其他行业技术的结合,TheStrategist分享道:

Grok 3.5是下一个重大突破,AI更新将是巨大的。想象一下Grok 3.5与爱因斯坦结合…

种种迹象表明,Grok 3.5的发布似乎指日可待,或许就在今晚!

作为马斯克旗下xAI公司的主打产品,每一次更新都备受关注。

在距离马斯克承诺的「本周发布」只剩最后几小时的今天,Grok 3.5能否如期带着「第一性原理」的强大能力登场?

拭目以待!

或许,Grok的全球攻势,正刚刚开始!

(文:AGI Hunt)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往