DeepSeek R1 说这次是小升级，实测后我不信！

深夜传来一个好消息！DeepSeek AI 团队悄悄放了个大招。他们升级了 DeepSeek R1 模型。这次升级引起了不小的轰动。

昨晚就有传言 DeepSeek R1 又更新了？，当时不知真假，此前被 R2 的各种要来的消息给搞怕了。

一、DeepSeek R1：不止于快，更有深度

这次 DeepSeek R1 的升级，不是简单的小修小补。根据用户的反馈和一些技术圈的讨论，新版本的 R1 模型在几个核心能力上有了显著的进步。

大家普遍提到，新模型的”思维链”（CoT）能力好像变强了。它现在能像一些国际顶尖模型那样，进行更深层次的思考。写出来的东西也更自然，格式也更好。

简单说，新 R1 的特点可以概括为：

深度思考：能像谷歌等大厂模型一样，想得更深。
写作能手：写东西更自然，排版也更漂亮。
独特风格：不只是快，思考也更全面周到。
持久专注：复杂的任务，能持续思考 30 到 60 分钟。

这让人非常期待。这意味着，我们有了更强大的国产 AI 工具。

二、新 R1 有多强？来点实际的！

光说不练假把式。我们来看几个例子，体验一下新 R1 的威力。

示例 1：写一个贪吃蛇游戏

一个简单的提示词，让 AI 写一个贪吃蛇游戏。

提示词：

创建一个贪吃蛇游戏，页面美观、好看。

R1 输出：

比之前的版本好太多了，那个小蛇至少增加了个眼镜。

示例 2: AI 创作一个交互式产品特性展示卡片

让 AI 设计一个现代化的产品特性卡片，当鼠标悬停在卡片上时，显示更多详细信息并带有平滑的动画效果。

提示词：

请帮我设计一个产品特性展示卡片。我希望它看起来现代、简洁。
卡片上需要显示一个图标、一个标题、一句简短描述。
当鼠标放上去的时候，卡片能平滑地展开，显示更详细的几句话说明，并且卡片本身可以稍微放大一点作为反馈。
请用 HTML、CSS 和 JavaScript 实现这个效果，把所有代码放在一个 HTML 文件里。

R1 输出：

示例 3: AI 编写一个简单的待办事项列表 (To-Do List) 应用

让 AI 创建一个基础的待办事项列表应用，用户可以添加任务、标记任务为完成、以及清除已完成任务。

提示词：

我想制作一个简单的待办事项网页应用。
它需要有一个输入框让我可以添加新的待办事情，旁边有一个"添加"按钮。
添加的事项会显示在一个列表里。
列表里的每件事项前面要有一个复选框，勾选后表示这件事做完了，做完的事情文本上最好能有条删除线。
我还需要一个按钮，按下去可以把所有做完的事情都清除掉。
如果能让这些待办事项在我刷新浏览器后还保留着，那就更好了（用本地存储实现）。
请用 HTML、CSS 和 JavaScript 实现，所有代码都在一个 HTML 文件中。

R1 输出：

示例 4: 设计 UI 原型，对比 Claude4

提示词：

我们即将推出一款名为 "LinguaFlow" 的 AI 语言学习 App。它的核心特点是：
1.  通过真实对话场景练习口语。
2.  AI 智能纠错，实时反馈。
3.  个性化学习计划，根据用户水平和目标定制。
请你使用 html 为这款 App 设计一个 UI 原型。要求：抓住痛点，突出优势，语言活泼，吸引年轻用户。

Claude4 输出：

R1 输出：

Claude4 输出：

大家可以对比下，R1 的 UI 设计比 Claude4 谁更好？

通过这些多样化的示例，我们可以看到 DeepSeek R1 在理解复杂指令、生成不同风格文本以及辅助编程和设计方面的潜力。

怎么使用？

打开 DeepSeek 网页 https://chat.deepseek.com/、下载 DeepSeek 官方 App 可立即使用。

三、技术背后：DeepSeek R1 的”内功心法”

DeepSeek 每次版本升级都搞得很低调，目前连个官方的发布公告都没有，只是在 Hugging Face 上开源了 DeepSeek-R1-0528 模型。相比那些动不动就搞个发布会，然后一开就是好几个小时的，DeepSeek 的这种低调，反而让人感觉更靠谱。

虽然 DeepSeek 官方没有给出非常详细的技术文档，但从他们在 Hugging Face 上开源的 config.json 文件中，我们还是能看出一些门道。

这个模型是基于 DeepseekV3ForCausalLM 架构的。一些关键参数也展示了它的规模和设计：

hidden_size: 7168 (隐藏层大小)
intermediate_size: 18432 (前馈网络中间层大小)
max_position_embeddings: 163840 (最大序列长度，非常惊人！)
num_hidden_layers: 61 (隐藏层数量)
vocab_size: 129280 (词汇表大小)

它还用到了混合专家模型（MoE）的一些技术，比如：

n_routed_experts: 256 (路由到的专家数量)
num_experts_per_tok: 8 (每个 token 使用的专家数量)

这些参数说明，DeepSeek R1 是一个精心设计的大模型。它有能力处理非常长的文本，理解复杂的模式。

看起来这不是一个小的升级。

四、中国 AI 的新篇章

DeepSeek R1 的这次升级，无疑给中国 AI 领域注入了新的活力。

我们看到了国产大模型在快速进步。它们不仅在追赶，还在一些方面展现出自己的特色和优势。这对于开发者、创业者和普通用户来说，都是一个好消息。

当然，AI 的发展之路还很长。但每一次重要的进步，都让我们离那个更智能的未来更近一步。

DeepSeek R1，未来可期！期待 R2 早日发布！

（文：AI智见录）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

一、DeepSeek R1：不止于快，更有深度

二、新 R1 有多强？来点实际的！

示例 1：写一个贪吃蛇游戏

示例 2: AI 创作一个交互式产品特性展示卡片

示例 3: AI 编写一个简单的待办事项列表 (To-Do List) 应用

示例 4: 设计 UI 原型，对比 Claude4

怎么使用？

三、技术背后：DeepSeek R1 的”内功心法”

四、中国 AI 的新篇章

发表评论 取消回复

发表评论取消回复