关注我,记得标星⭐️不迷路哦~
在科技界一片喧嚣之中,DeepSeek 团队于近日深夜低调地对其 V3 基座模型进行了一次重要的更新,版本号升级至 DeepSeek-V3-0324。此次更新并未进行大规模宣传,而是以一种“悄无声息”的方式在 Hugging Face 上发布,供用户下载和部署. 尽管如此,新版本一经推出,其在代码能力方面的显著提升便迅速引发了社区的广泛关注和热烈讨论.

✨代码能力跃升,媲美闭源旗舰
根据多方用户的实测反馈,DeepSeek-V3-0324 最令人瞩目的亮点在于其代码生成和理解能力. 许多测试者表示,在数学推理和前端开发等领域,新版本的表现甚至优于 Claude 3.5 和 Claude 3.7 Sonnet. X 平台上的博主「@KuittinenPetri」更是指出,DeepSeek-V3-0324 能够轻松免费地创建精美的 HTML5、CSS 和前端代码,认为 Anthropic 和 OpenAI 面临了新的挑战.
例如,仅凭一个简单的提示,DeepSeek-V3-0324 就能够为一个名为「NexusAI」的 AI 公司创建一个外观精美的响应式首页,并将所有内容包含在一个 HTML5 文件中。生成的代码长达 958 行,并且实现了一个交互式的、适用于移动设备的网站,甚至包括所有需要的图像. 「@KuittinenPetri」认为,DeepSeek-V3-0324 是 DeepSeek 最好的非推理模型,不仅在创意写作方面表现出色,现在也比 R1 更擅长生成 HTML5 + CSS + 前端代码. 另一位网友也成功地让 DeepSeek-V3-0324 创建了一个网站,模型一口气写了 800 多行代码,生成的网站布局也非常完美.
多场景实测,展现强大编程潜力
为了更全面地评估 DeepSeek-V3-0324 的编程能力,多位测评者进行了不同场景的测试,并将其与旧版 V3、Claude 3.7 和 o1 pro 等模型进行了对比.
-
文字转可视化网页: 在将文字描述转化为交互式网页的测试中,DeepSeek-V3-0324 相较于旧版 V3 展现了显著的进步,不仅网页内容更加丰富,UI 设计和排版也得到了明显的提升,甚至超越了 Claude 3.5 到 3.7 的升级幅度. 值得一提的是,DeepSeek-V3-0324 能够根据详细的提示,将 PDF 文件内容转化为美观的中文可视化网页,这在之前通常被认为是 Claude 3.7 的优势.
-
生成 3D 动画: 在通过 JS 代码库生成可交互的 3D 演示效果的测试中,新版 V3 能够将巧克力制作的每个步骤建模出来,并且标签可以互动,点击查看侧边栏,虽然与 Claude 相比仍有提升空间,但远超旧版 V3.
-
UI 组件设计: 在设计天气预报 UI 组件的测试中,V3-0324 在动画展现和天气文字标注的准确性上都有进步,表明其在生成具有实用价值的用户界面方面具备更强的能力.
-
物理世界模拟: 在模拟小球在一个旋转的六边形内弹跳的测试中,DeepSeek-V3-0324 精准地实现了小球的碰撞效果,虽然存在一些小瑕疵,但整体表现优于旧版 V3,并且能够与 o1 pro 相媲美.
-
AI 游戏生成: 最引人注目的是,DeepSeek-V3-0324 能够仅凭一句话生成可玩的像素贪吃蛇游戏,并且带有音效和 AI 辅助模式. 尽管在复杂性和完美度上可能与 Claude 3.7 的 extend thinking 模式仍有差距,但能够完成一个功能完整的游戏本身就展现了其强大的编程能力.
编写一个 p5.js 程序,显示球在旋转的六边形内弹跳。球应该受到重力和摩擦力的影响,并且它必须逼真地从旋转的墙壁上反弹。来自@AK
完成“弹跳球旋转圆周”测试。来自@Freshski
✨技术特性与成本优势
虽然 DeepSeek-V3-0324 并没有公布详细的模型卡,但已知其参数为 6850 亿. 值得一提的是,DeepSeek V3 是一个拥有 6710 亿参数的混合专家模型(MoE),其中 370 亿参数处于激活状态. 为了解决传统 MoE 模型中专家负载不均衡的问题,DeepSeek 对 V3 进行了创新,提出了辅助损失免费的负载均衡策略,通过引入“偏差项”动态调整专家负载,从而提升模型性能和训练效率. 此外,V3 还采用了节点受限的路由机制,以减少大规模分布式训练中的通信成本.
除了强大的性能,DeepSeek-V3-0324 还延续了更加宽松的 MIT 开源协议. 更为重要的是,其 API 价格相较于 OpenAI 的 o1-pro 便宜了至少 50 倍. 与 Claude 3.7 相比,DeepSeek v3 的输入价格是其十分之一以上,输出价格在标准时段是其十三倍以上,而在优惠时段更是达到了二十七倍. 这种极具竞争力的价格优势,加上其开源的特性,无疑将极大地推动 AI 编程的普及和发展.
DeepSeek-V3-0324 的此次升级,在代码能力方面取得了令人瞩目的进步,不仅在多项编程任务中展现出强大的实力,更在某些方面能够与 Claude 3.5/3.7 Sonnet 等顶尖模型相媲美. 其开源、高效且高性价比的特点,预示着 AI 编程的全民普惠时代或将加速到来. 随着更多第三方平台接入 DeepSeek 新版 V3,开发者和普通用户都将能够以更低的成本体验到先进的 AI 编程能力,这无疑将为整个 AI 生态注入新的活力,并推动更多创新应用的涌现. 令人期待的是,DeepSeek 在拥有强大的代码能力 V3 和顶级的推理能力 R1 之后,未来 R2 的表现将更加值得关注.
(文:每日AI新工具)