Gemini CLI 使用指南:解决网络问题+多模态玩法+浏览器控制。

Gemini CLI

Gemini CLI

上篇文章介绍了Gemini cli:

这波太顶了,谷歌版Claude Code发布, Gemini CLI 免费开源、Gemini 2.5 Pro 百万上下文加持!


但一些小伙伴即便登录了,后面反馈也调用失败。

其实上次在评论区说过这个解决方法,需要魔法+设置一下代理地址。

那么本期我们看一下windows怎么安装Gemini cli并设置代理地址(mac等同理,仅命令不一样)

先从安装开始,执行它(前提本机装好Node):

npm install -g @google/gemini-cli

gemini

执行gemini命令之后,会默认以使用 Google 账户认证的方式免费使用


免费用户每分钟 60 次请求,每天 1000 次,百万上下文gemini2.5 pro


然后你需要在 PowerShell  或 CMD中设置代理地址(分临时和永久,建议永久)

一、CMD 的设置方式

临时设置方式(当前窗口有效):

set HTTP_PROXY=http://127.0.0.1:7891

set HTTPS_PROXY=http://127.0.0.1:7891

注意,是不是7891得看你自己具体的端口了。这方面不多说。

图形界面永久设置

Win + S 搜索“环境变量” → 点击“编辑系统环境变量”;

进入“环境变量”设置页面;

在“系统变量”中添加:

变量名:HTTP_PROXY,变量值:http://127.0.0.1:7891

变量名:HTTPS_PROXY,变量值:http://127.0.0.1:7891

验证:

2: 在 PowerShell 中正确配置

# 1. 临时设置代理(正确语法)

$env:HTTP_PROXY = “http://127.0.0.1:7891”

$env:HTTPS_PROXY = “http://127.0.0.1:7891”

# 3. 验证设置

echo $env:HTTP_PROXY

# 2: 永久设置环境变量

# 添加到 PowerShell 配置文件

notepad $PROFILE

# 在文件中添加:

$env:HTTP_PROXY = “http://127.0.0.1:7891”

$env:HTTPS_PROXY = “http://127.0.0.1:7891”

设置完之后就可以重新打开cmd或者 PowerShell  启动Gemini CLI 了

gemini

另外如果不以免费账户登录的方式,你还可以以api的方式启动。去AI studio里获取key即可。

# 设置 API 密钥后启动

$env:GEMINI_API_KEY = “你的API密钥”

gemini


同样的api也可以永久设置,像前面那样。

配置完成后,测试是否正常工作:

# 3. 测试简单对话

>你好?


下一步:配置成功后,您可以:

  • 1. 基础使用: 直接输入问题进行对话

  • 2. 文件操作: 让 Gemini 分析和编辑代码文件

  • 3. 项目分析: 在项目目录中运行,分析整个代码库

  • 4. 创建 GEMINI.md: 自定义 Gemini 的行为和上下文

比如把自己常用的工作目录的结构在系统提示词里和它介绍清楚,再指挥它干活的时候就不用精确给它文件夹路径了,它自己能猜出来。

另外,这个模型多模态的。它可以看懂你图片,按照具体语义来为图片命名。这是很多其他命名工具没有的。


继续往后讲,你还可以让他看视频听音频等。

在“免费”gemini 2.5 pro这种超强多模态模型加持下,Gemini cli无疑是一个智能的本地ai助手。这里的本地指的是:比起你在gemini网页端上传文件和它对话,他更有效率,可以把你整个电脑的数据作为上下文。

以前也看过不少用ai来做这些本地分类管理的。不过那个时候还没有 gemini 2.5 pro,现在他免费提供。所以 gemini cli可以好好利用。


比如你也可以用它和一些第三方的python工具库进行协作

  • Pandas:强大的数据处理和分析库,适合做 Excel 数据处理、CSV 操作等。

  • Openpyxl 或 xlrd/xlwt:专门处理 Excel 文件的工具,可以与 Gemini CLI 配合,处理更复杂的表格数据。

  • Pandoc:一个万能的文档转换工具,可以将不同格式的文档(如 Markdown、Word、PDF 等)进行相互转换。

  • FFmpeg:用于处理音视频的开源工具,适合音视频的格式转换、剪辑、合成等工作。

  • SpeechRecognition:用于音频转文本,将语音输入转化为可处理的文本格式,可以与 Gemini 结合处理语音命令等任务。

  • Matplotlib/Seaborn:用于生成数据可视化图表,可以帮助将处理的数据以图表形式展示出来。


当然以前介绍很多的Aider,是这种类型的助手。只不过里面的模型得我们自己去配api。现在谷歌是给你免费的。而且好用的模型。

实际的工程编码方面,现在的 Gemini cli可能完全打不过。Cladue Code,但是他可以完全用来做上面介绍的这些事。

所以我们继续看看用例。

前面说了,他这个多模态挺强的。所以你可以这样玩。可以@本地文件,比如ppt,然后得到讲解音频等等。


另外还有人用类似这个手机操作Gemini CLI的思路:

Cursor 发布网页版,随时随地手机上干活,Jetbrains 全家桶免费一年 , Claude Code手机使用与监控。

嘿 Gemini:“打开 firefox 并转到 youtube 音乐”  

通过将 Gemini CLI 流式传输到浏览器,您可以从任何其他支持浏览器的设备远程控制任何设备。

视频中,使用智能手表来控制智能电视……无需在手表上进行设置。


用来流式传输 Gemini CLI 的方法,可以做到让任何东西控制电脑上的gemini cli,从而控制电脑(给gemini cli 装上以前介绍的各种mcp,解锁更多玩法):

基本上是这样的: 

– 在机器 A 上安装 Gemini CLI 

– 将你的终端暴露在 Web 上(警告:有风险)

 – 在设备 B 上打开浏览器并转到计算机 A 的 IP – 从设备 B 控制计算机 A

用到这个工具:ttyd – 通过 Web 共享您的终端:https://github.com/tsl0922/ttyd



Gemini Cli 能够让你更方便访问用户电脑所有数据,其他更多好玩的,可以自行探索。

不过,也不一定非要为了用它而用它。毕竟完成很多目标,我们已经有各种更适宜的工具或者网站。

另外,一些命令:

Gemini CLI – /mcp    


Gemini CLI – /tools    


Gemini CLI – shell 模式


更多AI实践与资讯

本号知识星球 (汇集ALL 订阅频道合集和其他):

AI 绘画元方法:不肝提示词,文章直出封面。(端到端篇)

如需职业技术证书可联系:AIGCSD,工信部线上学习,在线考试拿证

🔗另,有使用这两款产品的,下面是优惠链接:

1、自己订阅海外AI服务—— Wildcard: Visa 和 Master 海外代付
https://bewildcard.com/i/BJDUHWVX (开卡优惠1美元)

2、购买可直接使用的AI产品,银河录像局优惠码:
银河大会员(¥200)包含下面几种AI: https://nf.video/DEBjE 优惠码:Aitrainee(95折)

🌟知音难求,自我修炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。

点这里👇关注我,记得标星哦~


(文:AI进修生)

发表评论