代码生成归档

DeepSeek 发布DeepSeek R1-0528

上午8时 2025/05/30 作者 NLP工程化

DeepSeek发布R1-0528，显著提升代码生成能力，推理速度和质量提高，性能接近OpenAI的o3等前沿模型，在数学、编程和复杂任务上表现出色。

下午4时 2025/05/29 作者量子位

UC Berkeley团队提出的新方法Intuitor通过优化模型自身的置信程度来提升大模型的复杂推理能力，无需外部奖励信号或标准答案。与传统强化学习相比，Intuitor能有效减少无效响应并提高模型在数学和代码生成任务中的表现。

下午4时 2025/05/29 作者 APPSO

」，甚至可以说有点佛系，在微信交流群发了一句：
「DeepSeek R1 模型已完成小版本试升级，欢

下午11时 2025/05/26 作者机器之心

扩散式「发散思维链」—— 一种面向扩散语言模型的新型大模型推理范式。该方法将反向扩散过程中的每一步中

上午11时 2025/05/23 作者硅星人Pro

s 4 和更侧重效率的 Claude Sonnet 4。新模型在编程能力上实现了重大突破，Opus

下午4时 2025/05/20 作者量子位

视频新人博主陶哲轩展示了如何使用GitHub Copilot来证明数学定理，从函数极限问题入手，演示了求和、求差和求积定理的证明过程，并强调了正确引导Copilot的重要性。

下午4时 2025/04/30 作者 AI前线

称 Qwen3），并迅速登顶多项大模型测评榜单，引发了全行业的关注。
据介绍，Qwen3 在推理、指

下午4时 2025/04/29 作者 APPSO

源了新一代自研模型 Qwen 3(千问 3），性能全面超越 DeepSeek-R1、OpenAI o