Nanobrowser 是一个开源的 Chrome 浏览器扩展,支持通过大语言模型(LLM)驱动的多代理协作,实现复杂的网页自动化任务,可作为 OpenAI Operator 的免费替代方案。
多代理系统
Planner(规划者):负责制定和优化任务执行策略。
Navigator(导航员):浏览网页并执行操作。
Validator(验证者):检查任务是否成功完成并提供反馈。
高度灵活的LLM支持
支持用户使用自己的 LLM API 密钥(如 OpenAI 或 Anthropic)。
可以为不同的任务分配不同的语言模型,满足个性化需求。
核心功能
任务自动化:用户可通过简单指令自动完成网页操作,如抓取新闻、搜索商品、分析GitHub项目等。
实时交互:扩展提供侧边栏界面,显示任务进度并支持实时调整任务。
历史记录:可查看和管理以往任务的交互记录,方便回溯和优化任务流程。
无需订阅,完全本地运行
所有操作在本地浏览器内完成,保证数据隐私和安全性。
用户无需支付订阅费用,只需为使用的 LLM API 支付费用。
快速安装指南
下载最新版本的 nanobrowser.zip 文件。
在 Chrome 扩展程序页面(chrome://extensions/)启用开发者模式,加载解压后的扩展。
配置 LLM API 密钥,并选择模型以激活多代理功能。
未来开发计划
增加更多 LLM 提供商的集成支持。
引入浏览器操作的安全防火墙,确保任务执行安全性。
提供内置任务模板,简化用户操作。
总结:Nanobrowser 是一款功能强大的 AI 网页自动化工具,通过多代理协作机制和用户自定义 LLM 支持,使用户可以高效完成各种网页操作任务,且无需支付高昂订阅费用,非常适合开发者和数据采集爱好者使用。

参考文献:
[1] https://github.com/nanobrowser/nanobrowser
(文:NLP工程化)