DeepSeek 发布DeepSeek R1-0528:
-
代码能力能力显著提,可快速生成高质量代码 -
现在能够像 Google 模型一样进行深入推理 -
改进写作任务 – 更自然、格式更好 -
独特的推理风格——不仅快速,而且深思熟虑 -
长时间思考——每个任务最多 30-60 分钟 -
问题修复:改进了早期 R1 模型的重复、格式混乱和语言混合问题
Benchmark 评测:在由 UC Berkeley、MIT 和 Cornell 开发的 LiveCodeBench 代码生成评测中:
-
R1-0528 的推理能力与 OpenAI 的 o3等前沿模型性能相当,略低于o4 mini,尤其在数学、编程和复杂推理任务上表现出色
-
优于 xAI 的 Grok 3 mini 和阿里巴巴的 Qwen 3

最新调用Deepseek-R1-0528 API 的网站:
-
Openrouter 地址:https://openrouter.ai -
GMI tutt: https://inference-engine.gmicloud.ai -
Novita tutt: https://novita.ai -
Nebius tbtit: https://studio.nebius.com -
Inference toti: https://inference.net
参考文献:
[1] 详细介绍:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main
[2] 模型地址:https://www.xiaohu.ai/c/xiaohu-ai/deepseek-deepseek-r1-0528
知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。
(文:NLP工程化)