集推理规划、工具执行、上下文管理于一体的开源全能 AI Agent 框架：II-Agent

II-Agent 是一个开源 Python 框架，它结合了强大的 LLM 推理和丰富的工具支持，可以跨领域自主规划、执行和自动化复杂任务。

简介

现在的 AI 可不只是聊天机器人！它能帮你规划、决策，甚至替你做事。
来自 Intelligent-Internet 的 II-Agent 是一个开源的 Python 框架，让你轻松拥有这种能力。
通过强大的大语言模型（LLMs），比如 Claude、Gemini 或 DeepSeek，II-Agent 不仅能“思考”，还能通过丰富的工具、网页自动化、代码执行等功能完成任务——全在一个统一的平台上搞定！

为什么选择 II-Agent？它解决了啥问题？

传统 AI 工具通常只能干一件事：要么生成文本，要么分析数据，要么搜网页。想搞复杂工作流，你得拼凑一堆库、脚本和 API，忙得焦头烂额。II-Agent 把这些都整合起来了！它能让你：

•规划多步骤任务（比如研究或编码）•检查中间结果，必要时重试•调用工具（文件操作、命令行、浏览器自动化、处理 PDF/音频/图片）•保持超长上下文，轻松处理数百页的交互•通过友好的 Web UI 或简洁的 CLI 交互

你相当于有了一个“AI 同事”，能自动搞定研究、内容创作、编程辅助、数据分析、工作流自动化等等——省去你自己搭系统的麻烦。

核心功能与设计理念

多领域智能

•一个代理搞定研究、写作、编码、数据分析、自动化、问题解决。•不用换工具，II-Agent 全程包办。

灵活的 LLM 支持

•支持 Anthropic Claude（通过 API 或 Google Vertex AI）。•支持 Google Gemini（直接 API 或 Vertex AI）。•兼容 OpenAI GPT 模型。•根据性能、成本或偏好自由选择模型。

规划 + 自我反思循环

•把目标拆成子任务，规划步骤，然后执行。•出错时会反思问题并调整策略，就像真人一样聪明。

丰富的工具生态

•文件系统：智能读写、编辑代码。•命令行：在安全沙盒中运行脚本。•浏览器自动化：用 Playwright（含基础视觉功能）点击、输入、抓取网页。•多媒体处理：提取 PDF 内容、转录音频、生成图片或视频。

智能上下文管理

•保留完整的对话历史，包括规划、推理和工具日志。•自动修剪或压缩旧上下文，保持在 token 限制内（最高约 120,000 tokens）。

交互式 UI 和 CLI

•Web UI：基于 React 的前端，通过 WebSocket 实时展示“代理思考”过程。•CLI：轻量级终端界面，适合服务器或快速脚本。

开源与可扩展

•Apache-2.0 许可，代码随便看、改、扩展。•模块化结构，方便加新工具或集成自定义模型。

最佳使用场景

•研究与事实核查
自动执行多步骤网页搜索，交叉验证来源，整理结构化笔记，总结结果。•内容生成
撰写博客、文章、技术文档、故事，甚至整个网站，还能用工具拉取实时数据。•数据分析与可视化
清理数据集、跑统计分析、生成图表或交互式图，自动编译报告。•软件开发助手
写代码、优化代码、调试、跑测试，甚至在沙盒里执行代码，堪称虚拟 pair-programmer。•工作流自动化
协调脚本、浏览器任务、文件管理和部署流程，只用一个能聊天的代理。•通用问题解决
拆解复杂问题，探索备选方案，排查错误，逐步头脑风暴。

II-Agent 与其他框架有啥不同？

•LangChain 给你一堆零件，II-Agent 直接给你一个能跑的完整代理。•Auto-GPT 能循环调用 GPT，但容易丢上下文或卡住。II-Agent 的反思和上下文管理更靠谱。•CrewAI 把任务分给多个代理，增加协调成本。II-Agent 让一个代理按顺序搞定所有角色。

示例工作流：打造一个 Snake 游戏

假设你说：
“用 Python 和 Pygame 做一个简单的 Snake 游戏，告诉我怎么跑。”

II-Agent 的步骤：

1.规划：•创建 snake_game.py 文件•写 Pygame 代码，包括游戏循环、蛇、食物、控制逻辑•测试游戏，安装缺失的依赖•打包或截图结果2.执行工具：

# 代理创建文件touch snake_game.py# 代理通过 LLM 写代码# 代理运行：python snake_game.py# 如果缺 Pygame：pip install pygame# 重试直到游戏跑起来

3.反思与重试：•遇到错误就修代码或装库•反复运行直到成功4.交付结果：•提供最终的 snake_game.py 文件•给运行说明：python snake_game.py 就能玩

这展示 II-Agent 像一个开发者一样：规划、编码、运行、交付一个能用的程序，全程自己搞定！

开始上手

前置条件

•Docker Compose（推荐）•Python 3.10+•Node.js 18+（用于前端）

1. 克隆与配置

git clone https://github.com/Intelligent-Internet/ii-agent.gitcd ii-agentcp .env.example .env# 编辑 .env 文件，添加你的 LLM 和搜索密钥：#   ANTHROPIC_API_KEY=your_claude_key#   GEMINI_API_KEY=your_gemini_key#   OPENAI_API_KEY=your_openai_key#   TAVILY_API_KEY=your_search_key

如果需要高级功能，还可以设置 SerpAPI、FireCrawl、Jina 或多媒体生成的可选密钥。

用 Docker 运行（简单模式）

chmod +x start.sh stop.sh./start.sh           # 构建并启动后端 + 前端# 等待容器启动...# 浏览器打开：http://localhost:3000

停止：

./stop.sh

手动设置（不用 Docker）

后端：

python -m venv .venvsource .venv/bin/activate      # Windows 上：.venv\Scripts\activatepip install -e .python ws_server.py --port 8000

前端：

cd frontendnpm installnpm run dev# 打开：http://localhost:3000

CLI 使用

# 确保 .env 有 LLM 密钥python cli.py# 或用 Vertex AI：GOOGLE_APPLICATION_CREDENTIALS=path/to/creds.json \  python cli.py --project-id YOUR_PROJECT_ID --region YOUR_REGION

项目结构一览

ii-agent/├── cli.py                # 命令行界面├── ws_server.py          # WebSocket 后端├── src/ii_agent/# 核心实现│├── agents/# 代理逻辑│├── llm/# 模型客户端│├── tools/# 工具定义│└── utils/# 辅助工具├── frontend/# React 前端├──.env.example          # 环境变量模板├── start.sh / stop.sh    # Docker 辅助脚本└── pyproject.toml        # Python 项目配置

总结

II-Agent 是一个生产就绪的开源 Python 框架，让每个人都能用上自主 AI 代理。它自带规划、自我反思、丰富的工具集、智能上下文管理和 GUI/CLI 界面，帮你自动化研究、内容创作、编码、数据分析、工作流等等，全在一个平台搞定！无论你是 AI 研究员、数据工程师还是软件开发者，II-Agent 都能当你的 AI 同事，帮你省时间、搞定复杂任务。得益于 Apache-2.0 许可和模块化设计，你还能随便检查、扩展和贡献代码。今天就试试 II-Agent，体验 agentic AI 的未来吧！

👉 GitHub: https://github.com/Intelligent-Internet/ii-agent

👉 文档与博客: https://ii.inc/web/blog/post/ii-agent

祝你自动化愉快！

（文：PyTorch研习社）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

简介