集推理规划、工具执行、上下文管理于一体的 开源全能 AI Agent 框架:II-Agent

II-Agent 是一个开源 Python 框架,它结合了强大的 LLM 推理和丰富的工具支持,可以跨领域自主规划、执行和自动化复杂任务。

简介

现在的 AI 可不只是聊天机器人!它能帮你规划、决策,甚至替你做事。
来自 Intelligent-Internet 的 II-Agent 是一个开源的 Python 框架,让你轻松拥有这种能力。
通过强大的大语言模型(LLMs),比如 Claude、Gemini 或 DeepSeek,II-Agent 不仅能“思考”,还能通过丰富的工具、网页自动化、代码执行等功能完成任务——全在一个统一的平台上搞定!

为什么选择 II-Agent?它解决了啥问题?

传统 AI 工具通常只能干一件事:要么生成文本,要么分析数据,要么搜网页。想搞复杂工作流,你得拼凑一堆库、脚本和 API,忙得焦头烂额。II-Agent 把这些都整合起来了!它能让你:

规划多步骤任务(比如研究或编码)检查中间结果,必要时重试调用工具(文件操作、命令行、浏览器自动化、处理 PDF/音频/图片)保持超长上下文,轻松处理数百页的交互通过友好的 Web UI 或简洁的 CLI 交互

你相当于有了一个“AI 同事”,能自动搞定研究、内容创作、编程辅助、数据分析、工作流自动化等等——省去你自己搭系统的麻烦。

核心功能与设计理念

多领域智能

一个代理搞定研究、写作、编码、数据分析、自动化、问题解决。不用换工具,II-Agent 全程包办。

灵活的 LLM 支持

支持 Anthropic Claude(通过 API 或 Google Vertex AI)。支持 Google Gemini(直接 API 或 Vertex AI)。兼容 OpenAI GPT 模型。根据性能、成本或偏好自由选择模型。

规划 + 自我反思循环

把目标拆成子任务,规划步骤,然后执行。出错时会反思问题并调整策略,就像真人一样聪明。

丰富的工具生态

文件系统:智能读写、编辑代码。命令行:在安全沙盒中运行脚本。浏览器自动化:用 Playwright(含基础视觉功能)点击、输入、抓取网页。多媒体处理:提取 PDF 内容、转录音频、生成图片或视频。

智能上下文管理

保留完整的对话历史,包括规划、推理和工具日志。自动修剪或压缩旧上下文,保持在 token 限制内(最高约 120,000 tokens)。

交互式 UI 和 CLI

Web UI:基于 React 的前端,通过 WebSocket 实时展示“代理思考”过程。CLI:轻量级终端界面,适合服务器或快速脚本。

开源与可扩展

Apache-2.0 许可,代码随便看、改、扩展。模块化结构,方便加新工具或集成自定义模型。

最佳使用场景

研究与事实核查
自动执行多步骤网页搜索,交叉验证来源,整理结构化笔记,总结结果。
内容生成
撰写博客、文章、技术文档、故事,甚至整个网站,还能用工具拉取实时数据。
数据分析与可视化
清理数据集、跑统计分析、生成图表或交互式图,自动编译报告。
软件开发助手
写代码、优化代码、调试、跑测试,甚至在沙盒里执行代码,堪称虚拟 pair-programmer。
工作流自动化
协调脚本、浏览器任务、文件管理和部署流程,只用一个能聊天的代理。
通用问题解决
拆解复杂问题,探索备选方案,排查错误,逐步头脑风暴。

II-Agent 与其他框架有啥不同?

LangChain 给你一堆零件,II-Agent 直接给你一个能跑的完整代理。Auto-GPT 能循环调用 GPT,但容易丢上下文或卡住。II-Agent 的反思和上下文管理更靠谱。CrewAI 把任务分给多个代理,增加协调成本。II-Agent 让一个代理按顺序搞定所有角色。

示例工作流:打造一个 Snake 游戏

假设你说:
“用 Python 和 Pygame 做一个简单的 Snake 游戏,告诉我怎么跑。”

II-Agent 的步骤

1.规划创建 snake_game.py 文件写 Pygame 代码,包括游戏循环、蛇、食物、控制逻辑测试游戏,安装缺失的依赖打包或截图结果2.执行工具

代理创建文件touch snake_game.py# 代理通过 LLM 写代码# 代理运行:python snake_game.py# 如果缺 Pygame:pip install pygame# 重试直到游戏跑起来
3.反思与重试遇到错误就修代码或装库反复运行直到成功4.交付结果提供最终的 snake_game.py 文件给运行说明:python snake_game.py 就能玩


这展示 II-Agent 像一个开发者一样:规划、编码、运行、交付一个能用的程序,全程自己搞定!

开始上手

前置条件

Docker Compose(推荐)Python 3.10+Node.js 18+(用于前端)

1. 克隆与配置

git clone https://github.com/Intelligent-Internet/ii-agent.gitcd ii-agentcp .env.example .env# 编辑 .env 文件,添加你的 LLM 和搜索密钥:#   ANTHROPIC_API_KEY=your_claude_key#   GEMINI_API_KEY=your_gemini_key#   OPENAI_API_KEY=your_openai_key#   TAVILY_API_KEY=your_search_key

如果需要高级功能,还可以设置 SerpAPI、FireCrawl、Jina 或多媒体生成的可选密钥。

用 Docker 运行(简单模式)

chmod +x start.sh stop.sh./start.sh           # 构建并启动后端 + 前端# 等待容器启动...# 浏览器打开:http://localhost:3000

停止:

./stop.sh

手动设置(不用 Docker)

后端

python -m venv .venvsource .venv/bin/activate      # Windows 上:.venv\Scripts\activatepip install -e .python ws_server.py --port 8000

前端

cd frontendnpm installnpm run dev# 打开:http://localhost:3000

CLI 使用

# 确保 .env 有 LLM 密钥python cli.py# 或用 Vertex AI:GOOGLE_APPLICATION_CREDENTIALS=path/to/creds.json \  python cli.py --project-id YOUR_PROJECT_ID --region YOUR_REGION

项目结构一览

ii-agent/├── cli.py                # 命令行界面├── ws_server.py          # WebSocket 后端├── src/ii_agent/# 核心实现│├── agents/# 代理逻辑│├── llm/# 模型客户端│├── tools/# 工具定义│└── utils/# 辅助工具├── frontend/# React 前端├──.env.example          # 环境变量模板├── start.sh / stop.sh    # Docker 辅助脚本└── pyproject.toml        # Python 项目配置

总结

II-Agent 是一个生产就绪的开源 Python 框架,让每个人都能用上自主 AI 代理。它自带规划、自我反思、丰富的工具集、智能上下文管理和 GUI/CLI 界面,帮你自动化研究、内容创作、编码、数据分析、工作流等等,全在一个平台搞定! 无论你是 AI 研究员、数据工程师还是软件开发者,II-Agent 都能当你的 AI 同事,帮你省时间、搞定复杂任务。得益于 Apache-2.0 许可和模块化设计,你还能随便检查、扩展和贡献代码。 今天就试试 II-Agent,体验 agentic AI 的未来吧!

👉 GitHub: https://github.com/Intelligent-Internet/ii-agent

👉 文档与博客: https://ii.inc/web/blog/post/ii-agent

祝你自动化愉快!

(文:PyTorch研习社)

发表评论