DeepSeek 新模型 R1-0528 悄悄开源,与o3 相当,实测来了。

🍹 Insight Daily 🪺

Aitrainee | 公众号:AI进修生
Hi,这里是Aitrainee,欢迎阅读本期新文章。

DeepSeek 团队悄无声息地放出了他们推理模型的新升级版:DeepSeek R1。

更准确地说,是 DeepSeek R1-0528

这新模型是今天凌晨在 Hugging Face 上出现的,连个正经官宣都没有,直接 MIT 协议开源。

Hugging Face 页面上,社区已经开始帮忙补 Readme、提调整了,官方的博客估计也快了。

项目地址:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main

但从初步的反馈看,这模型挺猛,比原来的 DeepSeek 在长期推理、智能程度和真实世界应用方面都有提升。

更详细的,扒扒它的配置,大概是这么回事:

  • 还是基于他们DeepSeek-V3-0324模型。

  • 核心还是那个“思维链 (Chain of Thought)”推理,一步步展示逻辑过程,比较透明。

  • 主攻方向没变:数学问题、编程挑战、科学研究。

  • 架构进化了,但没大改:还是混合专家 (MoE) 设计,671B 总参数,每次只激活 37B,效率高。

  • 训练方法有改进:用了大规模强化学习 + 冷启动数据,解决了之前 R1 模型的一些毛病,比如无限重复、可读性差。

从社区曝出的LiveCodeBench基准测试成绩来看

新的 Deepseek R1-0528 的性能几乎与 LiveCodeBench 基准测试中的 o3 (High) 相当。

有网友做了一个精简版的总结,说它:
能像谷歌模型一样深度推理。
文本生成优化了,更自然,格式更好。
推理风格独特:不求快,但更严谨周密。
支持长时间思考:单任务处理时长能达到 30-60 分钟。

上手实测:

官方说这新模型能在复杂问题上花更长时间思考。

我们来直接上Prompt

第一个测试提示词如下:

效果:


挺不错的。

提供一组简单的数据(例如,过去一周每天的AI工具使用时长),要求模型用D3.js或Chart.js生成一个交互式的柱状图或折线图,鼠标悬停时显示具体数值,并带有简单的动画效果和自定义颜色方案。

这个一步到位,效果很不错。
下面90年代早期个人主页:

我想用 HTML 和 CSS 创建一个具有“90年代早期个人主页”风格的“访客留言板”区域的静态模拟。


风格要求:

背景颜色可以考虑使用亮色或带有简单图案的平铺背景(如果能用 CSS 实现)。

字体选择:使用像素字体或类似 Comic Sans, Times New Roman 的复古字体。

边框:元素边框可以使用明显的 3D 浮雕效果 (inset/outset) 或简单的粗线条。

颜色:可以使用饱和度较高的、略显“刺眼”的颜色组合。

包含元素:一个标题 "Guestbook!",一个“提交留言”按钮。这些都是静态展示,不需要真实功能。

请用 HTML, CSS, 和 JavaScript 实现一个简单的图片轮播/幻灯片组件。

 鲁迅文笔仿写:


根据部分信息进行推断和补全 (故事补全):
这是一个故事的开头:“侦探哈里森站在空荡荡的画廊中央,价值连城的钻石项链‘深海之星’不翼而飞。唯一的线索是地板上散落的几片奇异的蓝色羽毛,以及一个被强行撬开的保险柜,旁边放着一杯还冒着热气的红茶……”请你根据这个开头,继续把这个故事写下去,尝试推断窃贼可能的作案手法、身份特征,并最终揭开谜底。故事需要包含悬念、推理过程和合理的结局。字数在 800-1200 字左右。请注意细节的逻辑性和一致性。

网友:这是唯一一个能持续正确做对「9.9 – 9.11是多少」的模型。

与Claude4对比:不管是光线照射在墙上形成的漫反射,还是球在撞击后的运动方向,R1胜:

怎么用上这新模型?

可以通过 DeepSeek 官方 API,或者去 OpenRouter 搞个免费 API (也有付费版,没速率限制)。

One More Thing

AI 绘画元方法:不肝提示词,文章直出封面。(端到端篇)

AI 绘画“元方法”分享,免费绘图流,掌握思维比提示词更重要。(融图篇)

本号知识星球(汇集ALL订阅频道合集和其他):

星球里可获取更多AI实践和资讯:

MCP文章,从概念到实践再到自己构建:

MCP是什么:Windsurf Wave3:MCP协议让AI直接读取控制台错误,自动化网页调试不用复制粘贴了!Tab智能跳转、Turbo模式。
Cline的MCP商店来了。
MCP怎么配置、报错解决:Windows下MCP报错的救星来了,1分钟教你完美解决Cursor配置问题。

MCP实践:Cursor + MCP:效率狂飙!一键克隆网站、自动调试错误,社区:每个人都在谈论MCP!

最新MCP托管平台:让Cursor秒变数据库专家,一键对接Github,开发效率暴增!

Blender + MCP 从入门到实践:安装、配置、插件、渲染与快捷键一文搞定!

比Playwright更高效!BrowserTools MCP 让Cursor直接控制当前浏览器,AI调试+SEO审计效率狂飙!

手把手教你配置BrowserTools MCP,Windows 和 Mac全流程,关键命令别忽略。

2分钟构建自己的MCP服务器,从算数到 Firecrawl MCP(手动挡 + AI档)

太简单了!Cline官方定义MCP开发流程,聊天式开发,让MCP搭建不再复杂。

🌟 知音难求,自我修炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。

点这里👇关注我,记得标星哦~

(文:AI进修生)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往