DeepSeek 发布DeepSeek R1-0528

上午8时 2025/05/30 作者 NLP工程化

DeepSeek 发布DeepSeek R1-0528：

代码能力能力显著提，可快速生成高质量代码
现在能够像 Google 模型一样进行深入推理
改进写作任务 – 更自然、格式更好
独特的推理风格——不仅快速，而且深思熟虑
长时间思考——每个任务最多 30-60 分钟
问题修复：改进了早期 R1 模型的重复、格式混乱和语言混合问题

Benchmark 评测：在由 UC Berkeley、MIT 和 Cornell 开发的 LiveCodeBench 代码生成评测中：

R1-0528 的推理能力与 OpenAI 的 o3等前沿模型性能相当，略低于o4 mini，尤其在数学、编程和复杂推理任务上表现出色
优于 xAI 的 Grok 3 mini 和阿里巴巴的 Qwen 3

最新调用Deepseek-R1-0528 API 的网站：

Openrouter 地址：https://openrouter.ai
GMI tutt: https://inference-engine.gmicloud.ai
Novita tutt: https://novita.ai
Nebius tbtit: https://studio.nebius.com
Inference toti: https://inference.net

参考文献：
[1] 详细介绍：https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main
[2] 模型地址：https://www.xiaohu.ai/c/xiaohu-ai/deepseek-deepseek-r1-0528

知识星球服务内容：Dify源码剖析及答疑，Dify对话系统源码，NLP电子书籍报告下载，公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。

（文：NLP工程化）

发表评论取消回复