DeepSeek R1 + Agent 的下半场

DeepSeek火在多重因素叠加:R1 低成本达到OpenAI o1的效果 + 技术创新且Open AI(大家都在一个起跑线) + 产品Open CoT/文笔深厚 + 国产 + 等等。
DeepSeek R1使用示例prompt模版

一、DeepSeek 市场影响
DeepSeek 的开源策略对AI市场产生了结构性冲击,从市场分层来看(这里参考拾象-李广密大佬的分类,做了进一步扩展):
  1. ToC:影响最大,Chatbot市场首当其冲,DeepSeek应用在春节前就已登顶苹果中美两区App免费榜,直接超越ChatGPT等产品的,品牌关注度加速迁移。
    例如,某产品上面的功能比如“长文写作”、“诗歌”、研究报告”等等文字创作均是DeepSeek R1擅长的。
  2. ToB:短期难有影响,这些大型组织一般是外包采购+私有化部署,需求复杂,周期长,依赖长期合作与合规。另外,做过ToB小伙伴应该有体会,有时候客户也不知道用来做什么,要替TA想好落地场景,是需要能嵌入企业业务流程中的成熟化产品。

    PPT制作产品为例,涉及大纲与文本内容生成、排版、配图,以及初稿之后的美化等,还要能ppt文件导出,DeepSeek R1主要在第一环。

  3. ToD(开发者):短期影响有限,开发者更关注工具链成熟度与成本效率,强推理能力并不代表所有:多模态、Function Call等DeepSeek R1不支持,多轮能力排到第10(MultiChallenge榜单),Code方面Cursor官方说Sonnet在实际任务中的表现似乎仍然更好

二、仍然是 Agent 为王?

不管是DeepSeek R1还是Agent,最终还是为了解决更实际些的问题,两者不冲突,AI Agents是依托大模型为解决问题而生的系统

  1. 2024年底-2025春节DeepSeek R1之前

    1. Google:发布AI Agents白皮书;

    2. Anthropic:2025年将是Agentic系统之年;

    3. 英伟达 CEO 黄仁勋:“AI Agents是一个数万亿美元的机会”;

    4. OpenAI 发布首个AI Agent:Operator,替用户完成预订机票、晚餐等联网任务;

  2. 2025春节 DeepSeek R1 之后

    1. OpenAI 发布智能体Deep Search,用于深度研究

    2. SB OpenAI Japan成立,卖“水晶智能体”,为大型企业定制AI Agent

    3. OpenAI Sales Agent被泄露,为销售赋能

    4. Github Copilot 增加AI Agent模式,自动迭代代码

三、R1+Agent > 2
DeepSeek R1 + Agent未来发展方向如何?
OpenAI 已经给出了答案,在成立SB OpenAI Japan时,OpenAI宣布,其AI推理模型将在2025年发展成为Agent——能够为用户工作的AI。
Agent系统特点是需要较强的多步推理能力以及function call,而目前DeepSeek-R1是不支持function call的,DeepSeek R1的Think如何赋能Agent的Thought?

有小伙伴就要问了,DeepSeek R1联网不是function call吗?也可以用RAG实现哈,即:把联网搜索到的结果以Prompt形式给到R1。

DeepSeek R1 赋能 Agent
  • Plan A:直接ReAct
以DeepSeek-R1-Qwen2.5-32B为基座的Good Case(但整体实测下来会出现较多幻觉
Answer the following questions as best you can. You have access to the following tools:
Addition Tool: A tool for adding two numbersSubtraction Tool: A tool for subtracting two numbersDivision Tool: A tool for dividing two numbersMultiplication Tool: Atoolformultiplyingtwonumbers
Use the following format:
Question: the input question you must answerThought: you should always think about what to doAction: the action to take, should be one of [Addition,Subtraction,Division,Multiplication]Action Input: the input to the actionObservation: the result of the action... (this Thought/Action/Action Input/Observation can be repeated zero or more times)Thought: I now know the final answerFinal Answer: the final answer to the original input questionBegin!Question: 一种减速机的价格是750元,一家企业需要购买12台。每台减速机运行一小时的电费是0.5元,企业每天运行这些减速机8小时。请计算企业购买及一周运行这些减速机的总花费。

DeepSeek-R1-Qwen2.5-32B能给出推理逻辑与最终的答案:【9336元

<think>首先,需要计算购买12台减速机的总费用。每台减速机的价格是750元,因此购买总费用是750乘以12,得到9000元。
接下来,计算每天的电费。每台减速机每小时的电费是0.5元,运行8小时,所以每台每天的电费是0.5乘以8,等于4元。12台每天的总电费就是4乘以12,得到48元。
然后,计算一周的电费。一周有7天,所以总电费是48乘以7,等于336元。
最后,将购买费用和一周的电费相加,得到总花费。9000元加上336元,总共是9336元。</think>
Thought: 首先,我需要计算购买12台减速机的总费用。每台减速机的价格是750元,所以购买总费用是750乘以12。Action: MultiplicationToolAction Input: 750, 12Observation: 9000
Thought: 接下来,我需要计算每天的电费。每台减速机每小时的电费是0.5元,运行8小时,所以每台每天的电费是0.5乘以8。Action: MultiplicationToolAction Input: 0.5, 8Observation: 4
Thought: 然后,计算12台减速机每天的总电费。每台每天电费是4元,所以总电费是4乘以12。Action: MultiplicationToolAction Input: 4, 12Observation: 48
Thought: 接下来,计算一周的电费。每天电费是48元,一周7天,所以总电费是48乘以7。Action: MultiplicationToolAction Input: 48, 7Observation: 336
Thought: 最后,将购买费用和一周的电费相加,得到总花费。购买费用是9000元,电费是336元。Action: AdditionToolAction Input: 9000, 336Observation: 9336
Thought: 我现在知道最终答案了。Final Answer: 企业购买及一周运行这些减速机的总花费是 \boxed{9336} 元。

满血版DeepSeek R1的推理逻辑与最终答案回答:9336元

  • Plan B:特定场景训练

OpenAI Deep Research技术原理: 依托OpenAI o3进行端到端特定场景强化训练

这里对开发者而言:

(文:PaperAgent)

欢迎分享

发表评论