谷歌 Gemini 2.0 Flash 被玩疯了:去水印还能这么秀?

谷歌最新发布的 Gemini 2.0 Flash 模型最近被玩“疯”了。

主要是其 原生生图 这个功能。

什么意思?一般来说,AI 模型中,文本生成模型,如 GPT-4oDeepSeek-V3,和图像生成模型,如 Dall·e 3Stable Diffusion,都是分开的,因为走的是不同的技术路线。

而谷歌率先打破了这一“限制”。

Gemini 2.0 Flash 不仅支持文本聊天,同时支持图片生成,俗称:边聊天,边画图。详情看这里:ChatGPT还在靠DALL·E?谷歌Gemini直接实现原生生图!



而今天要说的,则是基于 Gemini 2.0 Flash 原生生图能力的一个被玩“疯”了的用法:去水印

在上面那篇详细的介绍文章里,我提到 Gemini 2.0 Flash 支持定向修图,比如换脸、换颜色等等。

这里的去水印也是同理。

比如下面这张照片,带有明显的 Getty Images 平台水印。水印主要有 2 处,左下角的一串数字编号,以及右下位置的平台标识。

如果让我们自己把这张图里的水印去掉,应该还挺困难的吧。估计 P 图老司机也得花点功夫。

而 Gemini 2.0 Flash,只需要几秒钟。

来放上去水印后的图片。

可以看到,左下角的数字已被完美去掉;右下的平台标识也几乎“完美”去除了,甚至 Gemini 还贴心的还原了被水印覆盖的部分。

这不得给 Gemini 2.0 Flash 竖个大拇哥!

Gemini 2.0 Flash 之所以能 原生生图、去水印,得益于其受训练的世界级知识。

正因此,去水印还不是最亮的,更厉害的是它能自动填补因删除水印而留下的空白。比如上面例子中长颈鹿的腿。

然而,Gemini 2.0 Flash 去水印也不是百分百完美。可以看到上面例子里长颈鹿身后的树,有一点模糊,正是去除水印的“后遗症”。

亲测对于信息/字较多的图片,Gemini 2.0 Flash 去水印的效果通常不会很好,尤其是中文字体。

比如下面这张图,是我从昨天的文章里扒下来的。右下角带有公众号自己加的水印。

而 Gemini 2.0 Flash 去水印后的图是这样的。

水印是去了,但图片里的其他字体也“一片狼藉”了。

此外,更为关键的是,每一张去水印后的图片左下角又被加上了 Gemini 自己的水印。

这操作,简直是“去掉你的,加上我的”,Gemini 是懂品牌宣传的!



结语

Gemini 2.0 Flash 去水印虽强,但这也恰恰反应了该模型安全审查的不足,因为未经版权所有者同意去除水印通常是非法的。



我是木易,一个专注AI领域的技术产品经理,国内Top2本科+美国Top10 CS硕士。

相信AI是普通人的“外挂”,致力于分享AI全维度知识。这里有最新的AI科普、工具测评、效率秘籍与行业洞察。

欢迎关注“AI信息Gap”,用AI为你的未来加速。



(文:AI信息Gap)

欢迎分享

发表评论