大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普,AI工具测评,AI效率提升,AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。
在昨天的文章《2024年11月LLM最新排名:Gemini夺冠,重回榜首!》中,我提到根据最新的LMSYS聊天机器人排行榜(Chatbot Arena Leaderboard),目前谷歌最新的模型Gemini-Exp-1121
超越GPT-4o
、o1
、Claude 3.5 Sonnet
夺得第一名。
这是来自LMSYS官方的认可。
今天来系统的聊一聊如何使用这个新模型,并且,是免费使用。
如何使用Gemini-Exp-1121
?
Gemini-Exp-1121
有两种使用方式:谷歌AI Studio和API调用。今天要介绍的就是第一种。
谷歌AI Studio地址:https://aistudio.google.com
打开上面谷歌AI Studio的官方链接,在左下角点击Sign in
登录,用任意一个谷歌账号(Gmail账号)登录就行。
登录后,可以看到有两种使用Gemini模型的方式,直接在谷歌AI Studio中使用,或生成API使用。这里我们选择第一种方式,Use Google AI Studio
,点击New Prompt
。
谷歌AI Studio的操作界面分为左、中、右三部分,我在下面的截图里用红字加上了解释说明。
1. 项目名称(Untitled prompt)
-
位于界面顶部。 -
用于为当前的Prompt项目自定义命名,方便管理和区分不同的任务。
2. 系统提示词(System Instructions)
-
提供可选的语气和风格指令,用于定义AI生成内容的上下文、语气、风格等。 -
这里的系统提示词其实类似于AI Agent中的提示词,即告诉大模型它在本次任务中的角色(Role)、简介(Profile)、背景信息(Background)、目标(Goals)、技能(Skills)、限制条件(Constraints) 等细节。建议使用结构化提示词,效果更好。
3. 聊天输入框(Type something)
-
位于界面底部。 -
在这里输入问题或指令,与模型交互。
4. 模型选择(Model)
-
模型选择:在右侧菜单中,可以通过下拉框选择不同的Gemini模型。截图中默认选的是 Gemini 1.5 Flash
。部分模型在鼠标选中后会在左侧显示模型的详细信息,如下图。 -
Token计数(Token Count):显示当前模型的上下文长度和Token消耗情况。比如最新的 gemini-1.5-pro-002
模型,其上下文窗口达到了惊人的200万tokens!
5. 温度(Temperature)
-
位于右侧菜单的中间。 -
通过滑块调整生成内容的随机性。 -
温度值低(如0):生成的内容更确定性和一致,适合精确回答。 -
温度值高(如1或更高,最高为2):生成的内容更随机、更具创造性。
6. 工具(Tools)
-
包括多个选项,可根据任务需求启用: -
Structured output:用于生成结构化输出,可以编辑Schema来定义生成的格式。 -
Code execution:允许模型运行代码。 -
Function calling:启用后,模型可以调用预定义的函数。 -
Grounding:启用后引入外部搜索结果(谷歌搜索),为回答提供额外信息。
7. 创建新Prompt(Create new prompt)
-
位于左侧导航栏。 -
点击后可以创建一个新的Prompt任务。
8. 其他
-
左侧导航栏: -
Get API key:用于获取Gemini模型的API Key。 -
My library:管理自己的Prompt库。 -
Prompt Gallery:浏览和选择已有的Prompt模板。 -
Developer documentation和Developer forum:提供开发者文档和其他资源。
Gemini-Exp-1121
实战
以下测试均为选择Gemini-Exp-1121
模型下的测试结果。
1. 草莓测试
Strawberry一词中有多少个字母“r”?
回答正确。
在接下来的解释中,思路也很清晰。
2. 辛普森悖论
小明从A班调去了B班,结果A和B两个班的平均分都比上升了,请问这是为什么?
这道题来自于统计学中著名的“辛普森悖论”(Simpson’s Paradox),指在分组数据中出现的一种现象,即当数据合并时,会出现与分组数据相反的趋势。
Gemini-Exp-1121
的回答正确,解释也提到了“辛普森悖论”,在解释为什么时总体思路正确。但给出的具体例子中存在一定的小问题。
3. 逻辑推理
三个囚犯 A、B 和 C,分别戴着红帽或蓝帽(但无法看到自己的帽子)。守卫说:“至少有一个囚犯戴着红帽。” A 说:“我不知道我的帽子颜色。” B 说:“我也不知道。” C 说:“我知道了。” 问 C 的帽子是什么颜色?
还是这道经典的“红蓝帽子”的问题。Gemini-Exp-1121
的回答完全正确,解释清晰明了,有理有据。
精选推荐
-
国内支付宝开通ChatGPT Plus和Claude Pro 2024最新教程! -
『AI保姆级教程』无需手机号!三分钟注册ChatGPT账号!2024年最新教程! -
『AI保姆级教程』手把手教你注册Claude账号!建议收藏!
(文:AI信息Gap)