细数Google最近迭代的5大AI功能,OpenAI要坐不住了!

作者|子川

来源AI先锋官

Google这波连着串的更新,太爽了!

就在昨天,Gemini推出了它们的Canvas功能!

不单单可以生成可视化网页,而且还能直接在画布上修改文章的内容,简直就是Claude Artifacts和ChatGPT的Canvas的结合体。

主要的功能有俩:文档编辑和代码实时预览功能。

Gemini Canvas的文档编辑功能,简直就是ChatGPT Canvas的翻版。

用户可以实时编辑文档,Gemini 提供即时反馈和建议,可选中任意段落,让Gemini帮你修改语气(更简洁、专业或口语化)、调整长度或格式。·

比如,让它生成一篇鲁迅风格的作品,并选中其中一段句子,提出修改建议:增加更多的细节。

除了和ChatGPT一样的Canvas功能之外,Gemini甚至更进一步。
可以直接在 Gemini上体验Claude的Artifacts功能。
支持多种编程语言,包括 Python、JavaScript 等,无论你是想开发 Web 应用、编写脚本,还是创建交互式体验,Gemini Canvas 都能满足你的需求。
重要的是实时迭代,用户可以要求 Gemini 修改代码,例如添加输入字段或按钮,并立即查看更新后的预览。
它的效果到底如何,我们来实际测试一下。
先来一个简单,让它生成可交互的五子棋小游戏,5秒不到,刷刷刷,一个简单的五子棋的代码就写出来了,甚至还可以和朋友在这个页面直接来上一局。

如果你觉得黑白两色的棋子不好看,还可以提出要求让Gemini进行修改。
也能生成产品的原型图。比如让告诉:我需要设计一个旅游App,帮我生成首页、功能页面、登录页的产品原型图。

也能用它生成此前大火的“一个小球在六边形框中跳动”的可视化页面。

同时,Gemini Canvas还支持协作共享,用户可以和他人实时协作编辑文档或代码,非常适合团队之间的合作。
这一周多时间里,Google动作不断,各种功能层出不穷,没有任何套路,开箱即用,重点还都免费。
下面我们来盘点最近Google上新的功能。
根据你搜索记录提供帮助功能
这个功能主要是通过整合用户Google搜索的历史数据,结合Gemini 2.0 Flash Thinking Experimental模型,实现了更精准的智能响应。
比如询问旅行建议时,系统会自动关联近期你使用Google搜索的景点、酒店或机票信息,生成结合个人偏好的行程方案。
换句话说,搜的越多,你的Gemini就越懂你。
Deep Research底层模型更新
终于!将Deep Research功能的底座换成了Gemini 2.0 Flash Thinking!
Deep Research的底层模型是Gemini 1.5 Pro,不过上线,就遭到群嘲模式,太不好用了。
而现在更换到Gemini 2.0 Flash Thinking模型,质量明显有了质的飞跃,给大家来直观感受一下。
提示词:搜索腾讯近5年的财报,并预测明年5月份的股票会是多少!
它首先会收集腾讯近五年的财报信息,并分析影响腾讯控股股票价格的因素,最后再进行预测。

跟OpenAI的Deep Research的不同是,他会给你把框架和节奏拆完,让你清晰的看到后面它会执行哪些步骤,你点击开始研究之后,他才会去整个互联网上去搜索。

动动嘴,就能在线P图
上周四,全网掀起的Gemini 2.0多模态热潮,只需动动嘴就能P图。
不仅能去水印,还能上传图片进行在线P图,让众多网友直呼效果好到爆。
可以直接用于图片上色。
还可以根据绘线稿图,生成对应的房屋渲染图。
短头发一秒也能变成长头发。
甚至还能一键换装。
是不是贼有意思。
小而精的Gemma 3
在上周,Google开源的Gemma 3模型,可直接在手机上跑的小模型,但实力不容小觑。
实力超DeepSeek V3、o3-mini,更是在LMArena竞技场中,Gemma 3取得了1339 ELO的高分排进了榜单前十。
谷歌称Gemma 3 是单个 GPU 或 TPU 上运行的功能最强大的模型。
相关阅读:谷歌推最强单加速模型Gemma 3,PK QwQ-32B 5道题仅对1个!
此外Google还透露后续将Veo 2模型同步到Gemini官网。
看到这里,是不是会感叹Google更新的节奏太快了,反观老对手OpenAI最近没有一点更新的动静,难道是在憋大招!

 

(文:AI先锋官)

欢迎分享

发表评论