OpenAI和谷歌接力干掉Photoshop

谷歌Gemini 2 flash发布后不久,
OpenAI的ChatGPT 4o也发布了自然语言P图功能,
甚至引发了美国人全民“吉卜力”热潮。
事实上,AI重绘功能,是MJ、Stable Diffusion至少用了两年的基本功能之一。
为什么之前没有那么火?
其实和LLM的基本逻辑有关。
长期以来,MJ、Stable Diffusion的玩家是个小众群体,
大家用工作流、提示词、ControlNet插件等方式玩的不亦乐乎,
还没有想到用自然语言控制这些工作流。
从谷歌和OpenAI的新功能来看,这应该是早就再开发的,
尤其是ChatGPT 4o,不太可能谷歌发布后立马就拿出来成品。
对于LLM玩家来说,万物都用自然语言控制,是大势所趋。
而AI绘画玩家虽然也在用自然语言控制画面,但还是误入歧途。
当年ControlNet出现的时候,就有两种观点,
一是生产力神器,未来可以取代Photoshop了;
二是异端,这种控制画面的方式不符合AI绘画的基本逻辑。
包括我在内,很长一段时间也习惯了ControlNet的方式来画图,
如今早已习惯ComfyUI这种工作流模式配合不同的节点来实现想要的效果。
甚至阿里、字节等团队,都拿出了开源的插件,对画面进行控制。
谷歌和OpenAI的自然语言P图的技术,从内核上来说,在开源AI绘画圈早就成熟了,但是就差那么一点点临门一脚。
2023年的时候,很多团队在用Stable Diffusion插件做电商图片工具,并取得了一些成绩。
随着自然语言P图普及,这类初创团队只好换方向。
当然了,我剩下的期待就是,DeepSeek v4是不是能有这个能力?

(文:路过银河AI)

欢迎分享

发表评论