细数Google最近迭代的5大AI功能，OpenAI要坐不住了！

作者｜子川

来源｜AI先锋官

Google这波连着串的更新，太爽了！

就在昨天，Gemini推出了它们的Canvas功能！

不单单可以生成可视化网页，而且还能直接在画布上修改文章的内容，简直就是Claude Artifacts和ChatGPT的Canvas的结合体。

主要的功能有俩：文档编辑和代码实时预览功能。

Gemini Canvas的文档编辑功能，简直就是ChatGPT Canvas的翻版。

用户可以实时编辑文档，Gemini 提供即时反馈和建议，可选中任意段落，让Gemini帮你修改语气（更简洁、专业或口语化）、调整长度或格式。·

比如，让它生成一篇鲁迅风格的作品，并选中其中一段句子，提出修改建议：增加更多的细节。

除了和ChatGPT一样的Canvas功能之外，Gemini甚至更进一步。

可以直接在 Gemini上体验Claude的Artifacts功能。

支持多种编程语言，包括 Python、JavaScript 等，无论你是想开发 Web 应用、编写脚本，还是创建交互式体验，Gemini Canvas 都能满足你的需求。

重要的是实时迭代，用户可以要求 Gemini 修改代码，例如添加输入字段或按钮，并立即查看更新后的预览。

它的效果到底如何，我们来实际测试一下。

先来一个简单，让它生成可交互的五子棋小游戏，5秒不到，刷刷刷，一个简单的五子棋的代码就写出来了，甚至还可以和朋友在这个页面直接来上一局。

如果你觉得黑白两色的棋子不好看，还可以提出要求让Gemini进行修改。

也能生成产品的原型图。比如让告诉:我需要设计一个旅游App，帮我生成首页、功能页面、登录页的产品原型图。

也能用它生成此前大火的“一个小球在六边形框中跳动”的可视化页面。

同时，Gemini Canvas还支持协作共享，用户可以和他人实时协作编辑文档或代码，非常适合团队之间的合作。

这一周多时间里，Google动作不断，各种功能层出不穷，没有任何套路，开箱即用，重点还都免费。

下面我们来盘点最近Google上新的功能。

根据你搜索记录提供帮助功能

这个功能主要是通过整合用户Google搜索的历史数据，结合Gemini 2.0 Flash Thinking Experimental模型，实现了更精准的智能响应。

比如询问旅行建议时，系统会自动关联近期你使用Google搜索的景点、酒店或机票信息，生成结合个人偏好的行程方案。

换句话说，搜的越多，你的Gemini就越懂你。

Deep Research底层模型更新

终于！将Deep Research功能的底座换成了Gemini 2.0 Flash Thinking！

Deep Research的底层模型是Gemini 1.5 Pro，不过上线，就遭到群嘲模式，太不好用了。

而现在更换到Gemini 2.0 Flash Thinking模型，质量明显有了质的飞跃，给大家来直观感受一下。

提示词：搜索腾讯近5年的财报，并预测明年5月份的股票会是多少！

它首先会收集腾讯近五年的财报信息，并分析影响腾讯控股股票价格的因素，最后再进行预测。

跟OpenAI的Deep Research的不同是，他会给你把框架和节奏拆完，让你清晰的看到后面它会执行哪些步骤，你点击开始研究之后，他才会去整个互联网上去搜索。

动动嘴，就能在线P图

上周四，全网掀起的Gemini 2.0多模态热潮，只需动动嘴就能P图。

不仅能去水印，还能上传图片进行在线P图，让众多网友直呼效果好到爆。

可以直接用于图片上色。

还可以根据绘线稿图，生成对应的房屋渲染图。

短头发一秒也能变成长头发。

甚至还能一键换装。

是不是贼有意思。

小而精的Gemma 3

在上周，Google开源的Gemma 3模型，可直接在手机上跑的小模型，但实力不容小觑。

实力超DeepSeek V3、o3-mini，更是在LMArena竞技场中，Gemma 3取得了1339 ELO的高分排进了榜单前十。

谷歌称Gemma 3 是单个 GPU 或 TPU 上运行的功能最强大的模型。

相关阅读：谷歌推最强单加速模型Gemma 3，PK QwQ-32B 5道题仅对1个！

此外Google还透露后续将Veo 2模型同步到Gemini官网。

看到这里，是不是会感叹Google更新的节奏太快了，反观老对手OpenAI最近没有一点更新的动静，难道是在憋大招！

（文：AI先锋官）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

发表评论 取消回复

发表评论取消回复