蒸馏技术归档 - 第2页共2页

「DeepSeek接班OpenAI」，最新开源的R1推理模型，让AI圈爆了

2025年1月21日12时作者机器之心

机器之心报道
机器之心编辑部
OpenAI 的最初愿景，最终被一家国内创业公司实现了？
昨晚，大模型

2025年1月21日12时作者 AI寒武纪

刚看完《DeepSeek-R1：强化学习驱动的大语言模型推理能力提升》论文。该研究证明了仅通过纯强化学习训练的模型，也能媲美甚至超越使用监督微调的数据训练的模型。这一突破展示了无监督学习的巨大潜力，并分享了小型模型通过蒸馏技术获得强大推理能力的方法。

2025年1月17日23时作者 AI寒武纪

OpenAI可能秘密构建了GPT-5并将其作为内部工具使用，而非公开发布。Anthropic通过蒸馏技术利用Opus 3.5提升了Claude Sonnet 3.6的性能。OpenAI在训练GPT-5方面面临巨大成本和AGI定义问题。尽管如此，他们可能不会公开发布GPT-5。

2024年12月16日18时作者新智元

新智元报道
编辑：编辑部 HZj
【新智元导读】
Ilya「预训练结束了」言论一出，圈内哗然。谷歌大