谷歌Gemini CLI:终端里的全能AI代理,免费开源的生产力新星

关注我,记得标星⭐️不迷路哦~


今天谷歌发布了Gemini CLI,一款开源的、运行在终端中的AI代理工具,被视为对标Claude Code和Cursor的“王炸级”产品。Gemini CLI 的推出,以其慷慨的免费额度、强大的模型能力以及全面的工作流支持,迅速在开发者社区引发关注,其GitHub项目上线不久便获得了过万的Star数量。

一、定位与核心特性:不止于编码,更擅长工作流自动化

Gemini CLI 的定位并非仅仅是一个“Agentic Coding Tool”(代理编码工具),而是一个更广泛的“Agentic Workflow Tool”(代理工作流工具)。这意味着它不仅拥有强大的代码编写功能,还能集成到日常的各种工作流中,成为开发者和普通用户的全能AI助手。

其核心特性包括:

  • 代码编写与大型代码库支持
    :能够利用Gemini 2.5 Pro模型进行代码编写,并支持高达100万token的超大上下文窗口,从而可以查询和编辑大型代码库。
  • GitHub集成
    :可以直接查询GitHub上的Pull Request (PR)、issues和git历史等。
  • 本地系统交互
    :具备与本地系统交互的能力,例如转换图片格式、按月整理PDF发票等。
  • 内置网络搜索
    :内置了Google Search工具,能够实时抓取网页内容,为模型提供最新的外部信息和事实依据,使回答不再局限于过时的训练数据。
  • 多模态能力
    :能够从PDF文档或草图生成应用程序。
  • 外部服务集成
    :可以调用Imagen、Veo、Lyria等模型进行媒体生成,例如根据照片内容生成视频并剪辑。
  • 完全开源与可扩展性
    :Gemini CLI基于Apache 2.0协议完全开源,代码透明可审查,并支持MCP(模型上下文协议)和插件扩展,可塑性极强。
  • 高度可定制
    :用户可以通过GEMINI.md等文件自定义系统提示和指令,将其调教成专属助手。
  • 无缝集成现有工作流
    :支持非交互模式,可轻松在自动化脚本中调用。

二、颠覆性优势:免费、强大、易用

Gemini CLI之所以被誉为“王炸”,主要得益于其以下颠覆性优势:

  • 免费使用,额度慷慨
    :用户只需使用个人Google账号登录,即可免费获得Gemini Code Assist许可。免费版直接使用Gemini 2.5 Pro模型,并享受其巨大的100万token上下文窗口。此外,它提供业界最大的免费额度:每分钟60次请求,每天1000次请求。这对于绝大多数个人开发者和学习者而言,几乎是无限制的使用体验,无需绑定信用卡。
  • 模型强大
    :直接提供顶配的Gemini 2.5 Pro模型,确保了代码生成和问题解决的高质量和准确性
  • 安装和使用门槛极低
    :安装过程非常简单,仅需一行命令即可完成。用户无需下载安装包或配置复杂的环境,只需在终端中运行命令,随后登录Google账号即可。
  • 开源与透明
    :代码完全透明,用户可以审查其安全性,甚至为其贡献代码。这种社区驱动的开发模式有助于工具的快速迭代和改进。

三、架构原理:模块化与可扩展性

Gemini CLI 的设计理念注重模块化和可扩展性。其主要由两个核心包和一套工具套件组成:

  1. CLI 包 (packages/cli)
    :负责处理用户输入、呈现最终输出和管理整体用户体验。它处理输入、管理历史记录、渲染显示以及设置CLI配置和主题。
  2. Core 包 (packages/core)
    :作为Gemini CLI的后端,接收来自CLI包的请求,协调与Gemini API的交互,并管理可用工具的执行。它包含与Google Gemini API通信的客户端、提示构建和管理、工具注册和执行逻辑、会话状态管理以及服务端配置。
  3. 工具套件 (packages/core/src/tools/)
    :这些是扩展Gemini模型功能的独立模块,允许模型与本地环境(如文件系统、shell命令、网络获取)交互。

典型交互流程
用户在终端输入命令。CLI包将输入发送给Core包。Core包构建提示并发送给Gemini API。Gemini API处理请求并返回响应,这可能是一个直接答案,也可能是需要调用工具的请求。当请求工具时,Core包会执行该工具,对于可能修改文件系统或执行shell命令的操作,会首先向用户提供详细信息并请求批准。工具执行结果随后发送回Gemini API,Gemini API处理后生成最终响应,再由Core包发送回CLI包,最终在终端显示给用户。

安全与确认机制许多工具,特别是那些可能修改文件系统或执行命令的工具(如write_fileeditrun_shell_command),都设计了安全防护,需要用户确认才能执行。所有工具的操作都受到沙箱执行的限制,以降低潜在风险,将模型及其更改与环境隔离。

四、丰富的使用场景与示例

Gemini CLI作为一款全能AI助手,能够处理多种任务,涵盖了从代码开发到日常自动化管理的广泛场景。

编码与调试

  • 代码库查询与分析
    :快速获取项目架构概览、分析依赖关系、识别性能瓶颈或扫描安全漏洞。
  • 智能代码编辑
    :直接修改代码文件,例如添加缓存层、重构代码、修复bug或优化算法。
  • 项目开发
    :实现GitHub Issue、迁移代码库到新版本、或从零开始生成新的应用程序。

内容创作与研究

  • 撰写文档、生成博客文章或进行深度技术研究。

任务管理与自动化

  • 本地系统交互
    :转换目录中的图片格式并根据EXIF数据重命名、按月整理PDF发票。
  • 自动化工作流
    :创建复杂的自动化任务,如生成包含git历史的幻灯片、构建完整的用户认证系统(包括后端API、前端表单、JWT处理、测试等)、初始化微服务项目或生成部署脚本。
  • 多模态应用生成
    :基于设计图生成React组件、创建移动应用、从CSV数据生成交互式图表或构建原型仪表板。
  • Git操作
    :总结项目最近的修改。
  • 网络交互
    :搜索React状态管理的最新最佳实践、获取API端点状态或查询库的官方文档。

具体示例

  • gemini > Write me a Gemini Discord bot that answers questions using a FAQ.md file I will provide
  • gemini > Give me a summary of all of the changes that went in yesterday
  • gemini > Convert all the images in this directory to png, and rename them to use dates from the exif data.
  • gemini > Organise my PDF invoices by month of expenditure.
  • gemini > 把所有当前文件夹内的图片使用veo3转换为视频,你需要分析照片的内容并给出一些生动的prompt让照片动起来,最后使用flow将他们剪辑到一起

五、安装与快速上手

使用Gemini CLI非常简单。

前置条件:确保您的电脑上安装了Node.js版本18或更高版本。可以通过在终端运行node -v来检查版本。

安装方式

  1. 临时运行

    npx https://github.com/google-gemini/gemini-cli
  2. 全局安装

    npm install -g @google/gemini-cli gemini

认证过程
启动Gemini命令行后,系统会自动引导您完成Google账号认证。
推荐使用个人Google账号登录,这将提供免费额度。您也可以选择通过Google AI Studio生成API Key并设置为环境变量来认证。对于高级用途或需要更高请求容量的用户,还可以考虑Vertex AI集成或Gemini Code Assist的企业级许可。

认证成功后,您就可以在终端中与Gemini进行交互了。

六、与现有AI工具对比

Gemini CLI 的发布,无疑给现有的AI辅助编程工具市场带来了新的冲击。

特性
Gemini CLI
Claude Code
OpenAI Codex CLI
Cursor
免费配额
✅ 慷慨
❌ 需付费
需自带模型
短期试用
开源
✅ 开源
❌ 闭源
✅ 开源
❌ 闭源
终端集成
✅ 原生
✅ 原生
✅ 原生
❌ IDE
MCP 集成
✅ 完整
✅ 完整
仅Rust实现
✅ 完整
内置搜索
✅ Google
✅ Claude
实际体验
⭐⭐⭐⭐⭐
⭐⭐⭐⭐⭐
⭐⭐
⭐⭐⭐⭐
易用性 门槛低到没有门槛,无需信用卡,对网络环境要求宽松 需绑定信用卡,有网络环境要求

较“重”,收费高
模型 Gemini 2.5 Pro



与其他工具相比,Gemini CLI在免费额度、开源性以及易用性方面表现突出,尤其对于个人开发者和普通用户而言,其免费且强大的特性使其成为“Vibe Coding”的新选择。

七、已知问题与未来展望

尽管Gemini CLI表现出色,但作为一款新发布的开源工具,也存在一些问题。用户反馈中提到了崩溃、体感速度较慢以及持续报错等问题。GitHub上的issue数量也在持续增长,这表明谷歌仍需在稳定性和性能方面持续努力。

然而,凭借谷歌的技术实力和其开源社区的推动,Gemini CLI的未来发展潜力巨大。它有望成为开发者日常工作流中不可或缺的AI伙伴,持续提升开发效率和体验。

(文:每日AI新工具)

发表评论