谷歌最新发布的 Gemini 2.0 Flash
模型最近被玩“疯”了。
主要是其 原生生图 这个功能。
什么意思?一般来说,AI 模型中,文本生成模型,如 GPT-4o
,DeepSeek-V3
,和图像生成模型,如 Dall·e 3
,Stable Diffusion
,都是分开的,因为走的是不同的技术路线。
而谷歌率先打破了这一“限制”。
Gemini 2.0 Flash
不仅支持文本聊天,同时支持图片生成,俗称:边聊天,边画图。详情看这里:ChatGPT还在靠DALL·E?谷歌Gemini直接实现原生生图!

而今天要说的,则是基于 Gemini 2.0 Flash
原生生图能力的一个被玩“疯”了的用法:去水印。
在上面那篇详细的介绍文章里,我提到 Gemini 2.0 Flash
支持定向修图,比如换脸、换颜色等等。
这里的去水印也是同理。
比如下面这张照片,带有明显的 Getty Images 平台水印。水印主要有 2 处,左下角的一串数字编号,以及右下位置的平台标识。

如果让我们自己把这张图里的水印去掉,应该还挺困难的吧。估计 P 图老司机也得花点功夫。
而 Gemini 2.0 Flash
,只需要几秒钟。
来放上去水印后的图片。

可以看到,左下角的数字已被完美去掉;右下的平台标识也几乎“完美”去除了,甚至 Gemini 还贴心的还原了被水印覆盖的部分。
这不得给 Gemini 2.0 Flash
竖个大拇哥!

Gemini 2.0 Flash
之所以能 原生生图、去水印,得益于其受训练的世界级知识。
正因此,去水印还不是最亮的,更厉害的是它能自动填补因删除水印而留下的空白。比如上面例子中长颈鹿的腿。
然而,Gemini 2.0 Flash
去水印也不是百分百完美。可以看到上面例子里长颈鹿身后的树,有一点模糊,正是去除水印的“后遗症”。
亲测对于信息/字较多的图片,Gemini 2.0 Flash
去水印的效果通常不会很好,尤其是中文字体。
比如下面这张图,是我从昨天的文章里扒下来的。右下角带有公众号自己加的水印。

而 Gemini 2.0 Flash
去水印后的图是这样的。
水印是去了,但图片里的其他字体也“一片狼藉”了。

此外,更为关键的是,每一张去水印后的图片左下角又被加上了 Gemini 自己的水印。
这操作,简直是“去掉你的,加上我的”,Gemini 是懂品牌宣传的!
结语
Gemini 2.0 Flash
去水印虽强,但这也恰恰反应了该模型安全审查的不足,因为未经版权所有者同意去除水印通常是非法的。
我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。
相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。
欢迎关注“AI信息Gap”,用AI为你的未来加速。
(文:AI信息Gap)