DeepSeek-V3-0526 闪现后秒删!

Unsloth 文档页面惊现DeepSeek 新模型,随后秒删!

You Jiacheng在浏览Unsloth文档时发现了一个令人震惊的细节:

DeepSeek-V3-0526竟然短暂出现在了更新日志中,然后立刻消失了

这不是眼花,确实有其事。

这里先介绍一下Unsloth:

Unsloth 是一家专注于让大语言模型微调训练更快的公司,由Daniel Han创建。这家YC S24孵化的公司开发了开源工具包,甚至被NASA使用过。

Daniel Han之前还在NVIDIA做机器学习工作,算是这个领域的老手了。

Unsloth 的核心技术是让用户能够以更快的速度对LLM进行微调训练,同时他们也提供各种模型的量化版本,让普通用户能在本地运行大型模型。

而让人震惊的是,Unsloth团队甚至为这个「不存在」的模型准备了详细的技术描述:DeepSeek-V3-0526性能堪比GPT-4.5和Claude 4 Opus,现在是世界上表现最好的开源模型

并称:这让它成为DeepSeek V3模型的第二次更新。

他们还提到了1.78位GGUF格式的量化版本,使用Unsloth Dynamic 2.0方法论,在5-shot MMLU和KL散度基准测试中表现最佳,意味着可以以最小的准确性损失运行量化的DeepSeek大语言模型

端午节发布理论

面对网友的质疑,Unsloth的Daniel Han给出了一个有意思的解释。他根据DeepSeek以往的发布规律做了预测:

R1是1月20日发布(周一,春节前一周)

V3-0324是3月24日发布(周一,清明节前一周)

Prover 2规模不大,但在4月30日发布(劳动节前)

V3-0526很有道理——周一,端午节前一周

Daniel Han坦承这完全基于传言和推测,但他表示这些传言来自可靠消息源,而且发布时间线(大约两个月间隔)很吻合,加上选在周一发布的习惯,所以「极有可能」。

DeepSeek铁杆粉丝的Teortaxes 也认同这个「端午节理论」,虽然对「R2见证者」来说有点失望,但确实合理。

所以,先静观其变。

内容被秒删

有网友试图访问这个链接时,发现确实已经显示为空

链接见:

https://docs.unsloth.ai/basics/deepseek-v3-0526-how-to-run-locally

Unsloth 官方文档页面也显示这是「为传言中的DeepSeek-V3-0526发布做准备的文章」,但页面上明确标注了没有官方确认其存在或潜在发布

并显示为12分钟前更新,其称:

本文旨在为传闻中的 DeepSeek-V3-0526 版本做准备。请注意,目前还没有关于其存在或可能发布的官方确认 。

此外,本文的链接也被隐藏起来。因此,对于任何混淆,我们深表歉意 – 在官方确认之前,这篇文章从未打算公开分享。

这让整个事件变得更加神秘。

有人询问这是不是新的V4模型还是V3的更新版本,Teortaxes明确回应:文档清楚地声称这是另一个V3版本

不过从社区的讨论可以看出,大家对DeepSeek的下一步动作都非常期待。

有人认为:DeepSeek-V4/R2如果不追求90%利润率,将会碾压美国实验室

DeepSeek的策略

从梁文锋的采访中可以看出DeepSeek的长远规划。

他们相信当前阶段是技术创新期,而非应用爆发期

长期目标是建立一个生态系统,让行业直接使用他们的技术和输出,其他人在他们的模型基础上开发B2B/B2C服务,而DeepSeek专注于基础研究。

关于竞争优势,梁文锋提到:

秘密不存在,但复制需要时间和成本。NVIDIA GPU没有隐藏的魔法,但追赶需要重建团队和追逐他们的下一代技术。这才是真正的护城河。

David Basile Filho透露,DeepSeek已经有不错的利润率,至少54%,这要归功于他们在开源周期间开源的技术。

并称:他们可以进一步推进并保持竞争力。

网友反应热烈

社区对这次「意外泄露」反应热烈。

有人认为如果DeepSeek能达到R1同样的效果,OpenAI就要被「煮熟」了

也有人更加理性,认为竞赛已经从模型转向产品,R2如果只是追赶的话,对市场的影响有限。

Ramon Vinicius预测:DeepSeek R2和V4将比R1更让西方惊讶,DeepSeek在数学和代码方面极其强大

不过也有反对声音。

Enzo Roux认为DeepSeek不会对当前美国市场产生重大影响,因为现有模型需要大量多样化的后训练,而DeepSeek没有足够的人力来做这件事,标准的SFT和RL不足以引起轰动

这次「意外曝光」或许只是又一次传言和昙花一现,无论DeepSeek-V3-0526是否真的存在,这个小插曲都反映出全球大家对DeepSeek下一步动作的强烈关注。

过往DeepSeek的每次发布都能在AI圈掀起不小的风浪,谁知道这次,会不会又是一个惊喜呢?

(文:AGI Hunt)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往