
先来看一下大家讨论最多的定义:AI Agent 是指人工智能代理(Artificial Intelligence Agent),是一种能够感知环境、进行自主理解、进行决策和执行动作的智能体。AI Agent 具备通过独立思考并调用工具,逐步实现既定目标的能力。
AIAgent 与大模型的区别在于:大模型与人类的交互通过提示词(Prompt)实现,用户的提示词是否清晰、明确会影响大模型的效果;AIAgent 仅需要设定一个目标,就能够针对目标进行独立思考并完成任务。
因为它们能够处理我们难以应对的海量信息。在这个信息总量指数级增长的时代,我们每天都要面对来自各行各业的数据冲击。AI Agent 像一个精明的筛选者,能够迅速识别出对我们有用的信息,帮助我们管理日常事务,如邮件处理、日程安排、会议管理等,让我们能够专注于真正重要的事情。它们的存在,避免了我们在纷乱嘈杂的信息世界中无所适从。
AI Agent 的个性化服务让我们每个人都能享受到量身定制的体验。它们通过学习我们的喜好和习惯,预测我们的需求,为我们提供更加贴心的服务。就像 Jarvis 不仅能理解托尼的指令,还能根据托尼的需求调整自身行为,提供更加个性化的支持。
从单一功能的 AI Agent 到复杂场景的 AI Agent,从提高效率、提供个性化服务、辅助决策、提高安全性,再到激发创造力,AI Agent 正逐渐成为我们生活中不可或缺的一部分。
正如钢铁侠的 Jarvis,AI Agent 不仅是一个工具,更是一个智能助手,帮助我们更好地应对生活和工作的挑战。而现在的 AI Agent 上手极其简单,几乎人人都可以创建属于自己的 AI Agent,打造独一无二的智能助手。
百度旗下的 AgentBuilder 又名“文心智能体平台”(官网地址:http://agents.baidu.com),界面如图 1 所示。
图 1 文心智能体平台的界面
核心优势:
-
开发难度低;
-
迭代调优工具完善;
-
分发渠道广泛,商业闭环链完整;
-
模型能力强大;
-
社区生态较活跃。
图 2 智谱清言的界面
核心优势:
-
用户交互体验优秀;
-
开源,支持多语言处理;
-
基础模型功能强大。
Kimi 是国内流行的 AI 大模型,是月之暗面科技有限公司(MoonshotAI)推出的智能助手产品。而 Kimi+(官网地址:https://kimi.moonshot.cn/kimiplus-square)就是其官方的智能体中心(如图 3 所示)。
图 3 Kimi+ 智能体平台的界面
截至本文成稿,Kimi 的智能体创建能力尚未对用户开放。它走的是精品 Agent 定制路线,旨在让每一个智能体都对用户有帮助。在技术方面,Kimi+ 的无损长文本处理能力令人印象深刻,支持高达 200 万字的文本处理,可以为用户提供更为全面和深入的服务。
通义千问是阿里巴巴推出的一个大型预训练模型,是阿里云自主研发的超大规模语言模型。通义千问智能体(官网地址:https://tongyi.aliyun.com/qianwen/agent/home)平台的界面如图 4 所示。
图 4 通义千问智能体平台的界面
目前,通义千问对创建智能体的自定义程度较低,以官方推荐为主。
扣子(官网地址:https://www.coze.cn)是字节跳动推出的 AI 智能体平台(如图 5 所示),用户可以在该平台上创建、配置、管理聊天机器人和智能体。扣子支持“单智能体模式”和“多智能体模式”,以适应不同复杂度的逻辑处理需求。
图 5 扣子的界面
核心优势:
-
插件:无线扩展的能力集;知识库:丰富的数据源;
-
长期记忆:持久记忆能力;
-
定时任务:快速创建定时任务;
-
工作流:灵活的工作流设计;
-
多 Agent:多任务串行。
图 6 腾讯元器界面
核心优势:
-
在分发与应用方面表现出色;
-
在市场前景和合作方面潜力巨大;
-
在资源丰富度上有明显优势;
-
微信生态系统的支持。
Dify(官网地址:https://dify.ai/zh)作为一个开源的 LLM 应用开发平台,在国内企业 B 端应用场景中得到了广泛使用。Dify 的操作界面如图 7 所示。
图 7 Dify 的操作界面
核心优势:
-
可视化提示词的编排;
-
支持多种大语言模型;
-
支持用户导入自由数据作为上下文;
-
API 驱动开发;
-
可视化审查 AI 日志,持续改进模型性能。
FastGPT 是一个基于 LLM 的知识库问答系统,提供开箱即用的数据处理、模型调用等能力(如图 8 所示)。同时,可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景。
图 8 FastGPT 的创建和调试应用
核心优势:
-
专属 AI 客服功能;
-
平台的可视化界面设计直观且用户友好;
-
自动数据预处理功能;
-
工作流编排灵活;
-
强大的 API 集成。
使用何种 AI Agent 平台,需要考虑以下几个方面:
-
明确需求:对于简单需求,常用的 Agent 平台有百度文心智能体平台、智谱清言等。对于复杂需求,比如需要编排工作流的场景,可以选用 Coze、腾讯元器、Dify 等。
-
评估平台的能力:这一步不仅涉及平台的核心功能,还需要考虑技术先进性、性能表现和可用性等多方面因素。
-
成本因素:不同平台在定价策略和成本结构上可能有很大差异,了解这些成本因素有助于在预算范围内做出最优选择。成本不仅包括平台的直接费用,还包括隐性成本和长期使用成本。
-
用户支持与社区活跃度:这不仅关系到搭建 Agent 过程中遇到问题时能否得到及时有效的帮助,还影响到团队的学习曲线和开发效率。一个活跃的用户社区和强大的官方支持,可以为 Agent 开发者提供丰富的资源和强大的支持网络,帮助他们更好地利用平台的功能。
-
可扩展性与灵活性:可扩展性与灵活性直接影响到平台能否适应项目的长期发展和不断变化的需求。一个具备良好可扩展性和灵活性的 AI Agent 平台,可以帮助开发团队在项目的各个阶段高效应对各种挑战,确保项目的持续成功。
本文摘编自《智能体设计指南:成为提示词高手和 AI Agent 设计师》(书号:9787111775843),经出版方授权发布,转载请保留文章来源。
《智能体设计指南:成为提示词高手和 AI Agent 设计师》是一本能帮助每个人轻松构建从提示词编写到 AIAgent 设计完整知识体系的实战指南,由 LangGPT 社区的的创始人等几位国内提示词编写和 AIAgent 设计领域的领军人物撰写,得到了硅基流动创始人袁进辉、润米咨询创始人刘润、通往 AGI 之路创始人 AJ 等众多行业专家的高度评价。
奖品《智能体设计指南》5 本,关注 【AI 前线】 公众号,回复关键字 “智能体” 参与抽奖。
云中江树,LangGPT 提示词社区创始人,中国提示词工程师大会联合发起人,知名 AI 智能体设计专家。
王照华,笔名“甲木”,LangGPT 社区联合创始人,PECChina 联合发起人,提示词专家,智能体设计师,“得到”AI 学习圈提示词课程主理人。
伊丽琦,笔名“小七姐”,提示词专家,WaytoAGI 共创作者,AI 知识管理体系辅导师,FLOWGPT 提示词培训师,文心大模型课程讲师,同时也是 1.5 万人提示词学习社群创建者。
李继刚,Prompt 布道师,爆火“Lisp 提示词”提出者,火爆全网“汉语新解”创作者,词生卡范式引领者。
(文:AI前线)