DeepSeek 发布DeepSeek R1-0528
DeepSeek发布R1-0528,显著提升代码生成能力,推理速度和质量提高,性能接近OpenAI的o3等前沿模型,在数学、编程和复杂任务上表现出色。
DeepSeek发布R1-0528,显著提升代码生成能力,推理速度和质量提高,性能接近OpenAI的o3等前沿模型,在数学、编程和复杂任务上表现出色。
DeepSeek发布V3-0324版本,推理性能大幅提升,并在多项基准测试中超越GPT-4.5。这次更新还增强了前端开发能力、工具调用能力和中文写作能力,同时采用了更高效的训练方法。
LLM模型通过纯强化学习提升推理能力,并提出无需监督数据的新方法。端侧模型性能提升主要依赖蒸馏而非强化学习,DeepSeek-R1-Zero展示了自我进化能力及语言一致性奖励的应用。
谷歌DeepMind团队提出了一种名为‘可微缓存增强’的技术,该技术通过引入外部协处理器来增强大语言模型(LLMs)的键值(kv)缓存,显著提升了推理性能,并在多个基准测试中提高了准确率和性能。