
新智元报道
新智元报道
【新智元导读】谷歌Canvas免费上线了!现在,所有用户都可以使用Gemini 2.5 Pro的Canvas了,谷歌激情放言:我们的TPU炙手可热,正在火上浇油。
Gemini 2.5 Pro的Canvas,向所有人开放了!
AI大战,再次升级。
奥特曼表示用户太热情,GPU在融化,在线求饶,团队要休息。
谷歌Gemini却表示:「我们的TPU热得发烫,而我们却要火上浇油。🔥」
Gemini宣布:每个用户都可以使用Gemini 2.5 Pro的Canvas功能。
从提示到原型,只要几分钟,谁都可以使用Canvas进行编程和创新。

谷歌不装了,摊牌了:就是算力多,OpenAI不服来战!
谷歌搞突袭:Canvas免费
其实,上个周末,Gemini的Canvas功能已被发现,但需支付200美元。

这次的关键的在于,谷歌终于开窍了:好东西不必藏着掖着,只给收费用户或者在高门槛的AI Studio里使用,抢占用户心智才是大事!
此时,OpenAI的GPU在融化。谷歌乘机搞突袭:TPU随便烧,只要用户越多越好!
甚至谷歌CEO劈柴,在线教网友如何使用Canvas。

GeminI官方放出了4个使用Canvas的例子,并表示欢迎用户解锁更多玩儿法。
1.使用p5js设计一个万花筒
鼠标移动,可生成对称图案。

2.胡乱的涂鸦变钢琴曲
把写在草稿纸上的涂鸦拍成照片,Gemini能制作成一首简单有趣的钢琴曲!

3.创建简单的可玩街机游戏
创建一个简单的可玩街机游戏,控制屏幕底部的球拍,将球弹起并摧毁一排排的方块。

4.限时颜色匹配游戏
制作一个有时间限制和根据准确性计分的颜色匹配游戏。

在网页端Gemini,免费用户已可以使用Canvas功能。
选中底部Canvas功能,系统推荐了3个任务:编写登录页面,写巴黎游记以及写Python脚本,监控系统性能。

更多精彩示例
更多关于Canvas的惊艳演示如下。
1.绘制「无限猫」

2.创建并发布网络应用

3.视觉模拟

4.3D动图

5.旋转四维超立方体中的超球面

6.鹈鹕骑自行车

7.《小行星》游戏

8.创建动态Jujujajaki网络

9.AI成精了!
沃顿商学院教授Ethan Mollick,把著名的「Sparks of AGI」论文给Gemini 2.5,并提示:「阅读这篇论文,并通过在Canvas中编码展示你自己的最佳火花」。
它一次就制作了一个小工具,而其他模型没有完成这个任务。

Gemini产品负责人访谈:谷歌如何构建Gemini
就在最近,Gemini的产品负责人Tulsee Doshi的访谈也放了出来。
她为我们详细揭秘了,谷歌团队是如何构建Gemini 2.5 Pro的。
「氛围测试」打破大模型魔咒,火速刷榜
Gemini 2.5 Pro的强大推理和编程能力,已经毋庸置疑。
负责人确凿地表示,这是谷歌开发过的最强大的模型。
谷歌的想法是:「我们必须马上将它推出,马上让开发者马上用上它!」
尤为显著的,就是它的代码能力。
它特别擅长开发有趣的网络应用、AI智能体程序,还非常擅长代码编辑与转换,堪称理想的编程助手。
另外,它还继承了Gemini Pro的所有优势,具备多模态能力,能理解视频和图像。
更为独特的是,Gemini 2.5 Pro还打破了许多大模型面临的「魔咒」——
当一个模型在推理方面很出色时,往往在用户体验或氛围上表现不佳。
它不仅基准测试强,语言风格上也很出色,这就是为什么它能火速刷榜各大用户偏好相关的榜单。
这是因为,谷歌强调「氛围测试」(vibe check):模型不仅在技术上强大,还要在用户互动中自然、有趣、有用。
这种平衡,是通过精心的训练和评估实现的。
现在我们时常遇见的某种现象就是:当你不断优化某个随机指标时,其实并不符合用户对模型的真正期待。
而在Gemini 2.5 Pro上,谷歌真的做得很好。
2.5版本,也标志着模型范式的转变——
从此,所有Gemini模型都是「思考型」模型,思考能力,成为了它的核心特性。
代码能力提升:整个技术栈的合作
此前在AI界,一直有着「只有推理时计算才重要」的叙事。
而谷歌采用的团队合作,完全冲破了这种叙事。
比如为了提升代码能力,团队是从整个技术栈上优先考虑的——
从预训练角度,考虑的是什么样的数据对代码能力最重要;
从后训练角度,要考虑如何构建更好的网页应用;
从推理角度,就要研究如何帮助模型推理代码。
而在未来,Gemini模型还会继续向更智能、更高效的方向发展。
那时,开发者有希望能创建更复杂、更有用的应用程序。
(文:新智元)