II-Agent 是一个开源 Python 框架,它结合了强大的 LLM 推理和丰富的工具支持,可以跨领域自主规划、执行和自动化复杂任务。

简介
现在的 AI 可不只是聊天机器人!它能帮你规划、决策,甚至替你做事。
来自 Intelligent-Internet 的 II-Agent 是一个开源的 Python 框架,让你轻松拥有这种能力。
通过强大的大语言模型(LLMs),比如 Claude、Gemini 或 DeepSeek,II-Agent 不仅能“思考”,还能通过丰富的工具、网页自动化、代码执行等功能完成任务——全在一个统一的平台上搞定!
为什么选择 II-Agent?它解决了啥问题?
传统 AI 工具通常只能干一件事:要么生成文本,要么分析数据,要么搜网页。想搞复杂工作流,你得拼凑一堆库、脚本和 API,忙得焦头烂额。II-Agent 把这些都整合起来了!它能让你:
•规划多步骤任务(比如研究或编码)•检查中间结果,必要时重试•调用工具(文件操作、命令行、浏览器自动化、处理 PDF/音频/图片)•保持超长上下文,轻松处理数百页的交互•通过友好的 Web UI 或简洁的 CLI 交互
你相当于有了一个“AI 同事”,能自动搞定研究、内容创作、编程辅助、数据分析、工作流自动化等等——省去你自己搭系统的麻烦。
核心功能与设计理念
多领域智能
•一个代理搞定研究、写作、编码、数据分析、自动化、问题解决。•不用换工具,II-Agent 全程包办。
灵活的 LLM 支持
•支持 Anthropic Claude(通过 API 或 Google Vertex AI)。•支持 Google Gemini(直接 API 或 Vertex AI)。•兼容 OpenAI GPT 模型。•根据性能、成本或偏好自由选择模型。
规划 + 自我反思循环
•把目标拆成子任务,规划步骤,然后执行。•出错时会反思问题并调整策略,就像真人一样聪明。
丰富的工具生态
•文件系统:智能读写、编辑代码。•命令行:在安全沙盒中运行脚本。•浏览器自动化:用 Playwright(含基础视觉功能)点击、输入、抓取网页。•多媒体处理:提取 PDF 内容、转录音频、生成图片或视频。
智能上下文管理
•保留完整的对话历史,包括规划、推理和工具日志。•自动修剪或压缩旧上下文,保持在 token 限制内(最高约 120,000 tokens)。
交互式 UI 和 CLI
•Web UI:基于 React 的前端,通过 WebSocket 实时展示“代理思考”过程。•CLI:轻量级终端界面,适合服务器或快速脚本。
开源与可扩展
•Apache-2.0 许可,代码随便看、改、扩展。•模块化结构,方便加新工具或集成自定义模型。
最佳使用场景
•研究与事实核查
自动执行多步骤网页搜索,交叉验证来源,整理结构化笔记,总结结果。•内容生成
撰写博客、文章、技术文档、故事,甚至整个网站,还能用工具拉取实时数据。•数据分析与可视化
清理数据集、跑统计分析、生成图表或交互式图,自动编译报告。•软件开发助手
写代码、优化代码、调试、跑测试,甚至在沙盒里执行代码,堪称虚拟 pair-programmer。•工作流自动化
协调脚本、浏览器任务、文件管理和部署流程,只用一个能聊天的代理。•通用问题解决
拆解复杂问题,探索备选方案,排查错误,逐步头脑风暴。
II-Agent 与其他框架有啥不同?
•LangChain 给你一堆零件,II-Agent 直接给你一个能跑的完整代理。•Auto-GPT 能循环调用 GPT,但容易丢上下文或卡住。II-Agent 的反思和上下文管理更靠谱。•CrewAI 把任务分给多个代理,增加协调成本。II-Agent 让一个代理按顺序搞定所有角色。
示例工作流:打造一个 Snake 游戏
假设你说:
“用 Python 和 Pygame 做一个简单的 Snake 游戏,告诉我怎么跑。”
II-Agent 的步骤:
1.规划:•创建 snake_game.py
文件•写 Pygame 代码,包括游戏循环、蛇、食物、控制逻辑•测试游戏,安装缺失的依赖•打包或截图结果2.执行工具:
touch snake_game.py# 代理通过 LLM 写代码# 代理运行:python snake_game.py# 如果缺 Pygame:pip install pygame# 重试直到游戏跑起来 代理创建文件
snake_game.py
文件•给运行说明:python snake_game.py
就能玩这展示 II-Agent 像一个开发者一样:规划、编码、运行、交付一个能用的程序,全程自己搞定!
开始上手
前置条件
•Docker Compose(推荐)•Python 3.10+•Node.js 18+(用于前端)
1. 克隆与配置
git clone https://github.com/Intelligent-Internet/ii-agent.git
cd ii-agent
cp .env.example .env
# 编辑 .env 文件,添加你的 LLM 和搜索密钥:
# ANTHROPIC_API_KEY=your_claude_key
# GEMINI_API_KEY=your_gemini_key
# OPENAI_API_KEY=your_openai_key
# TAVILY_API_KEY=your_search_key
如果需要高级功能,还可以设置 SerpAPI、FireCrawl、Jina 或多媒体生成的可选密钥。
用 Docker 运行(简单模式)
chmod +x start.sh stop.sh
./start.sh # 构建并启动后端 + 前端
# 等待容器启动...
# 浏览器打开:http://localhost:3000
停止:
./stop.sh
手动设置(不用 Docker)
后端:
python -m venv .venv
source .venv/bin/activate # Windows 上:.venv\Scripts\activate
pip install -e .
python ws_server.py --port 8000
前端:
cd frontend
npm install
npm run dev
# 打开:http://localhost:3000
CLI 使用
# 确保 .env 有 LLM 密钥
python cli.py
# 或用 Vertex AI:
GOOGLE_APPLICATION_CREDENTIALS=path/to/creds.json \
python cli.py --project-id YOUR_PROJECT_ID --region YOUR_REGION
项目结构一览
ii-agent/
├── cli.py # 命令行界面
├── ws_server.py # WebSocket 后端
├── src/ii_agent/# 核心实现
│├── agents/# 代理逻辑
│├── llm/# 模型客户端
│├── tools/# 工具定义
│└── utils/# 辅助工具
├── frontend/# React 前端
├──.env.example # 环境变量模板
├── start.sh / stop.sh # Docker 辅助脚本
└── pyproject.toml # Python 项目配置
总结
II-Agent 是一个生产就绪的开源 Python 框架,让每个人都能用上自主 AI 代理。它自带规划、自我反思、丰富的工具集、智能上下文管理和 GUI/CLI 界面,帮你自动化研究、内容创作、编码、数据分析、工作流等等,全在一个平台搞定! 无论你是 AI 研究员、数据工程师还是软件开发者,II-Agent 都能当你的 AI 同事,帮你省时间、搞定复杂任务。得益于 Apache-2.0 许可和模块化设计,你还能随便检查、扩展和贡献代码。 今天就试试 II-Agent,体验 agentic AI 的未来吧!
👉 GitHub: https://github.com/Intelligent-Internet/ii-agent
👉 文档与博客: https://ii.inc/web/blog/post/ii-agent
祝你自动化愉快!

(文:PyTorch研习社)