
新智元报道
新智元报道
【新智元导读】谷歌的Gemini 2.0 Flash凭一句话PS的功能,还在全网不断掀起新的风暴!广告业直接被颠覆,模特从此彻底不存在了。去水印、梗图、交叉图像,已经被网友玩疯。甚至有人预言:谷歌已全面超越OpenAI,将率先实现AGI。
如今已经有人预测:谷歌DeepMind将比OpenAI率先实现AGI!
原因很明显,如今谷歌DeepMind在多个领域布局下的产品,已经表现出全面获胜之势,而且,它们并没有炒作。
最佳多模态:Gemini 2.0 Flash / Gemini 2.0 Pro Experimental
最佳原生图像生成:Gemini 2.0 Flash
最佳文本/图像到视频:Veo-2
最佳图像生成:Imagen-3
最大的上下文窗口:2M(Gemini 2.0 Pro Experimental)
对比之下,OpenAI近期最令人印象深刻的行动,大概就是发出15页提案,呼吁美国政府全面封禁DeepSeek、锁死中国AI了,这么一对比,简直高下立判。
总之,谷歌DeepMind不炒作,不对其他竞品评头论足,只是默默做事,给大众留下了非常清新的印象。
如今,它已经愈发势不可挡,而在机器人开发领域,如果仅是将额外开发的技术推向市场,或许就会引发巨大的冲击波。
左右滑动查看
学会超强推理的模型,更懂怎么生图了
「一句话就能PS」的功能,当即震惊了全部网友。
Gemini生成的开怀大笑的蒙娜丽莎
几天过去了,Gemini 2.0 Flash引发的余震,还在不断回响。
一句话去水印、交叉图像生成等功能,被网友们玩疯了。大家公认:它已经可以轻松取代Photoshop。
全模态图像生成器,跟其他AI生图模型最大的区别在哪里?
因为它自身具备的超强推理能力,能结合现实世界的知识生成更符合上下文的图像,理解更多细节,更遵循文化背景特征。
其中,全程都是由Gemini模型完成,无需调用其他模型,只需通过自然语言提示。
此外,传统的AI生图器需要分开处理文本和图片,它则是能同时输出文本和插图,保持惊人的一致性。
真正的多模态能力:同时理解文字、图像,以及二者联系
理解世界知识:能做智能推理,结合现实世界知识生成准确内容
自然语言交互:仅用对话修改图片,真正实现一句话PS
如此强大、令人震撼的修图功能,不禁让网友Oleks推测:以买图为主业的公司,股价将暴跌、一泻千里!
一句话PS,收费PhotoShop被创飞
从11岁起从事视觉特效的Bilawal Sidhu表示,谷歌的Gemini新功能「一句话PS」将消除PS高手和小白之间的技术壁垒。
他展示了5个例子,用Gemini搞特效就是这么简单。
1. 将自己化身为Roblox和Minecraft角色
|
|
|
|
演讲图片变三维线框模型 |
2D变3D线框模型渲染效果 |
3. 给不同人物添加墨镜,表现良好
|
|
![]() |
![]() |
3D测试 |
雷达点云测试 |
![]() |
![]() |
补画:添加红色激光眼 |
扩画:扩大画面场景 |
![]() |
![]() |
![]() |
这张黑夜的照片,Gemini 2.0 Flash能让它秒变白天的图。
上下滑动查看
可以看出,在把夜景转化为白天的实景时,景观基本上准确的,没有幻觉,如果要挑毛病,就是根据夜景图像产生的图产生了对光照条件的幻觉。
简直让人疯狂。
有人不信邪,亲自上手尝试了一遍后,不得不承认:谷歌这次真的厉害了。
最令人惊喜的是,它几乎没什么限制,可以毫无阻碍地生成名人肖像和受版权保护的角色图像。
比如说,CMU机器学习博士James Campbell就尝试把马斯克P到了自己的办公桌上。
这活灵活现的神态,人物和背景自然地融为一体,就问谁能看出来是P的?
网友们也纷纷展开实测。感受就是:这个功能太伟大了!
从此,一句话p图真的到了next level。
上班要迟到了,需要火速编个理由,怎么办?打开Gemini 2.0 Flash,一键搞定。
上下滑动查看
一句话,美女手中的手机就变成了我们指定的那款。
Gemini 2.0 Flash和pika的结合,也发挥出了奇效。


![]() |
![]() |

上下滑动查看
![]() |
![]() |



![]() |
![]() |
去水印,网友们玩疯了!
而在去水印方面,Gemini 2.0 Flash也是一绝!

![]() |
![]() |


交叉图像功能,一句话「讲故事」
谷歌DeepMind研究及深度学习负责人,Gemini项目共同负责人Oriol Vinyals,被Gemini的新功能惊呆了!

左右滑动查看



游戏、漫画、动漫圈都炸了
Gemini 2.0 Flash这个新功能,甚至可以用来迭代图像,创建任何游戏!
![]() |
![]() |
同时,Gemini 2.0 Flash也直接攻陷了漫画圈。






![]() |
![]() |
![]() |
动漫创作的全流程,它都能依指示完成,比如把素描转换为线稿;填充基础色;添加一些柔和的阴影,光源位于左上角;添加一个室内背景,使其与当前的光源和阴影环境相匹配,使用合适的角度;调整为单色灰度,以符合轻小说插画风格等等
更多的测试demo,自己体会。


谷歌最新生成模型Gemini API
而且刚刚,又有好消息传来。


(文:新智元)