智能体(Agent)是指能够感知环境、根据感知做出决策并执行行动以实现特定目标的系统。在人工智能领域,Agent通常需要具备自主性、交互性、适应性和目标导向等特点。Agent可以是单一模态的,如仅处理文本信息的聊天机器人,也可以是多模态的,即能够理解和生成包括视觉、听觉等在内的多种类型的数据,Agent也可以是多个协同分工共同来解决复杂任务。
根据智能体数量与能力,可以分为:单一智能体、多模态智能体、多智能体
单一智能体
随着大型预训练语言模型的出现,如GPT系列,Agent的研究和应用进入了一个新的阶段。这些模型能够生成连贯、有逻辑的文本,使得基于语言模型的Agent能够更好地与人类用户进行更自然的交互,理解和响应用户的需求,执行复杂的语言任务。
一个具体的示例满血版DeepSeek-R1+【联网工具】智能体,以Agentic RAG或Function Call形式让R1接入搜索知识
(文:PaperAgent)