最近,斯坦福大学举办了一场关于 Agentic AI 的网络研讨会,探讨了什么是 Agentic 语言模型(Agentic LM),以及它们在实际中的应用方式。讲座内容涵盖了语言模型的基本概览、常见限制,以及提升模型智能性的设计模式,如反思(Reflection)、规划(Planning)、工具使用(Tool Usage)和迭代调用(Iterative Usage)等。此外,还会介绍 RAG(检索增强生成)技术在智能体应用中的角色。
📌 本次研讨会主要内容包括:
-
LLM 概览与局限性
-
Agentic LLM 的核心设计理念
-
工具使用与 RAG 技术
-
如何通过反思与规划增强 LLM 智能
👤 演讲者介绍:Insop Song
现任 GitHub Next 的首席机器学习研究员,曾在微软专注于将大语言模型用于提升工程师的工作效率。他开发过多个与代码、文档和 AI 自动化相关的项目,现为斯坦福在线 AI 专业课程的开发者与讲师。
如果你没时间或者是没条件观看整个视频,别担心,我已经为你总结了其中的关键内容。
🔍 什么是 Agentic AI?
传统的语言模型主要用于预测下一个词语,而 Agentic AI 则更进一步,赋予模型推理、检索、行动和反思的能力。换句话说,它们不再只是“复读机”,而是可以自主完成任务的智能体。
🧩 从预训练到指令跟随
LLMs 的训练分为两个阶段:
1. 预训练:模型在大量文本数据上学习语言结构。
2. 后训练:通过指令微调和人类反馈强化学习(RLHF),使模型更好地理解和执行人类指令。
这种训练方式使得模型不仅能生成语言,还能理解上下文和意图。
🎨 提示工程:与模型对话的艺术
与 LLM 互动不仅仅是提出问题,更像是编写乐谱,引导模型演奏出你想要的旋律。有效的提示包括:
-
清晰的指令:明确告诉模型你的需求。
-
示例提供:通过提供示例来指导模型的输出格式。
-
思维链(Chain of Thought):引导模型逐步推理,得出答案。
-
逐步提示:将复杂任务分解为多个步骤,引导模型逐步完成。
这种方法可以显著提高模型的准确性和实用性。
🛠️ 工具使用:打破模型的限制
LLM 本身无法访问实时信息,但通过集成外部工具,它们可以:
-
获取最新数据:如天气、新闻等。
-
执行代码:运行脚本,处理数据。
-
访问数据库:检索和更新信息。
这使得模型能够完成更复杂、更实用的任务。
🤖 Agentic AI 的实际应用
Agentic AI 已在多个领域展现出其潜力:
-
客户服务:自动处理退款、查询订单等。
-
研究助理:帮助搜索、总结和整合信息。
-
编程助手:自动调试代码、生成测试用例,甚至提交到 GitHub。
这些应用表明,Agentic AI 正在逐步改变我们的工作方式。
🧠 设计模式:让智能体更聪明
为了提升 Agentic AI 的能力,研究人员引入了多种设计模式:
-
规划(Planning):让模型先制定计划,再执行任务。
-
反思(Reflection):模型评估自己的输出,进行自我修正。
-
工具使用(Tool Use):集成外部工具,扩展模型功能。
-
多智能体协作(Multi-Agent Collaboration):多个模型协同工作,完成复杂任务。
这些模式使得 Agentic AI 更加灵活和高效。
📌 总结
Agentic AI 代表了人工智能发展的新阶段,使模型具备了更强的自主性和适应性。通过合理的训练、提示设计和工具集成,LLM 正在从语言生成器转变为智能体,广泛应用于各个领域。
如果你对 Agentic AI 感兴趣,建议观看斯坦福的完整研讨会视频,深入了解这一领域的最新进展。
https://www.youtube.com/watch?v=kJLiOGle3Lw
加入星球获取提示工程、RAG和Agent开发实践教程。

(文:PyTorch研习社)