R1归档 - 每时AI

DeepSeek升级，媲美OpenAI最强模型！

上午11时 2025/05/29 作者财联社AI daily

DeepSeek开源最新0528 R1版本，性能接近OpenAI o3模型，引发广泛关注。

R1–Zero强化学习路线新发现及R1思路用于GUI Agent动作预测方案

下午2时 2025/04/02 作者老刘说NLP

2025年4月1日，北京天气晴。文章介绍了R1进展中的两个工作，一是研究多种基础模型预训练特性的影响；二是将GRPO-RL强化用于Agent的UI动作预测，数据和奖励函数设计有趣。研究发现Qwen2.5模型在不使用模板的情况下有强大的推理能力，但模板会破坏数学解题能力。此外，文章还讨论了强化学习在图形用户界面（GUI）动作预测中的应用。

人工智能应用就是大模型能力+场景，基于大模型构建应用，首先要了解大模型的能力圈

下午2时 2025/04/01 作者 AI探索时代

大模型的应用在于多体验和尝试不同模型功能差异，理解其能力与其它技术的区别。

介绍了利用 DeepSeek R1 进行法律文档检索增强生成的实践经验

上午8时 2025/03/08 作者 NLP工程化

Skypilot介绍了利用DeepSeek R1进行法律文档检索和生成的经验，并总结了使用专门嵌入模型及加速推理的方法。

R1-Think能力如何用于RAG及多模态场景？Rank1及R1-Onevision实现思路解析

下午2时 2025/02/28 作者老刘说NLP

今天继续看RAG进展，看推理模型用于RAG的两个思路。
另一个看看将R1推理路径用于多模态模型的一个

传DeepSeek R2提速！字节豆包灰测深度思考，微软Copilot已免费开放

下午12时 2025/02/26 作者智东西

科技巨头纷纷推出深度推理模型。微软面向所有Copilot用户免费提供语音和深度思考功能，并宣布由OpenAI的o1模型支持。近期多家AI企业如OpenAI、谷歌等也发布了新的深度推理/深度思考模型。

周四聊：火山引擎 x DeepSeek-R1，企业落地 AI，怎么做更高效？

下午11时 2025/02/17 作者 Founder Park

R1 发布后，国内外多个云平台迅速部署，并邀请火山引擎专家分享 R1 使用经验。主要讨论企业如何使用推理模型、接入策略及未来方向。

DeepSeek 颠覆了什么？学习不靠“人盯”，AI自己“卷”自己

下午4时 2025/02/17 作者 AI前线

DeepSeek，纯强化学习路线到底有何不同
。在直播中，出门问问大模型团队前工程副总李维博士聚焦