刚刚,马斯克官宣:Grok 3.5 被砍,Grok 4 即将发布!

你有多久没用马斯克 xAI 的 Grok 了?

过去两个月,关注 Grok 的用户估计都有点困惑。

原本早该在 5 月初就上线的 Grok 3.5,迟迟不见动静。

马斯克本人也只是在 X 上说了句“还不够好,再打磨一周”。

一周变两周,两周变遥遥无期。

直到几小时前,Grok 终于有了新进展。马斯克在 X 平台发帖官宣:Grok 3.5 不上了,直接取消。接棒的是 Grok 4,计划在 7 月 4 日之后上线。



01|Grok 3.5:“消失”的半代版本

先梳理一下 Grok 3.5 的时间线:

  • 4 月底,马斯克在 X 上预告:Grok 3.5 即将上线,主打专业问答能力,特别是工程、编程类问题。
  • 5 月初,早期用户开始内测,但 xAI 官方始终没有明确上线时间。

  • 5 月中旬,马斯克回应:“还有点粗糙,再打磨一周。”

  • 5 月下旬 – 6 月中,xAI 官方继续沉默,虽然陆续有用户爆出一些内测截图,但无实质进展。

  • 6 月 21 日,马斯克突然发帖:或许 Grok 3.5 应该称之为 Grok 4,要用它重写整个人类知识库。

  • 6 月 27 日,他再次确认:最后一轮训练跑完就上线,时间点锁定在 7 月 4 日之后。

一句话总结:预热(≈ 过度炒作)两个月,原计划的 Grok 3.5,胎死腹中。

不是没做,而是做到一半,被弃了。

原因?马斯克没给出具体解释。

但结合一些爆料和媒体分析,大致有几个可能:

  • 性能不稳定,难以满足预期,尤其是复杂问题的准确率

  • 资源投入换代优先级调整,Colossus 超算集群资源集中转向 Grok 4

  • 希望“跳版本”制造更强的升级信号,这不新鲜,马总的一贯操作



02|Grok 4:一次人类的 “AI 知识清洗”?

Grok 4 明显带着更大的野心上场。

马斯克在多次发言中提到,Grok 4 的目标不只是提升推理或编码能力,而是要“重写整个人类知识库”。

拆解来看,Grok 4 有三个层面的升级:

1. 构建一个编码能力更强的子模型

Grok 4 目前正在进行最后一次大规模训练,主要面向代码生成、调试、项目级编程理解能力。

这一方向显然是对标 o3Gemini 2.5 ProClaude 4 和 DeepSeek-R1 这些强编码模型的。

2. 训练数据策略的变化

这个说法其实挺抽象。

马斯克提出要用 AI 自己来“过滤”原始语料。也就是先用 Grok 3.5(或 Grok 4 的早期版本)对现有数据做一次增删改;然后再用这些“清洗过的语料”去反向训练模型。

这个方案的初衷是避免“垃圾数据”、“旧认知”继续污染模型判断。

逻辑上能成立,但实操上非常挑战。比如怎么界定“垃圾数据”?谁来定义“错”与“对”?

3. 推理机制的升级

Grok 从 Grok 3 开始加入了“Think”模式,即:遇到复杂问题时不立刻作答,而是“思考”几秒到几分钟,模型在内部推理后再输出。

Grok 4 会在这个机制上做进一步优化,加入更多多轮推理、多步验证的逻辑,提升准确率和可信度。



03|Grok:从幽默聊天到知识重构

马斯克的 xAI 毋庸置疑,是有实力的。

毕竟,从 Grok 1 首次亮相到即将登场的 Grok 4,整个迭代周期也不过短短一年半。

时间
版本
关键词
2023.11
Grok 1
X 平台首发,主打幽默对话风格
2024.03
Grok 1.5
128K 上下文,推理能力大幅提升
2024.08
Grok 2
多模态、Grok-2 mini 同步上线
2025.02
Grok 3
Colossus 训练、百万上下文(未实现)、DeepSearch
2025.06
Grok 3.5
内测、跳票,最终取消
2025.07(预)
Grok 4
编码、知识库重构、推理机制升级


结语

马斯克的产品节奏,跳票是家常便饭,但跳完往往都能带来一个比预期更大的话题。

之前 Starship、Cybertruck、Grok 3 都是类似操作。

现在要看的,就是 Grok 4 到底能不能撑得起用户这两个月的“期待”。

最后,据说 xAI 团队目前的“画风”是这样的,大家自行体会一下。




我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的未来加速。



(文:AI信息Gap)

发表评论