贴身评测字节即梦3.0 PK GPT-4o:影视级2k高清,文字精准度飙升

作者沐风

来源AI先锋官


最近AI绘图领域可谓是热闹非凡。


GPT-4o带来的热潮还未褪去,字节即梦的图片模型又悄悄上线了3.0版本。


经即梦官方确认,今天开始进行小范围内测,部分用户登录账号后,在左侧生图模型即可看到“图片3.0”版本。



未获得测试资格的小伙伴也不要着急,你可以试着多注册几个账号,说不定哪个账号就可以使用即梦3.0版本。


去年12月,即梦上线了2.1版本,可以通过简单的指令,控制文字的颜色和位置等元素,快速生成中英文图像海报,号称“一句话生成海报”。


即梦2.1版本相比,即梦3.0版本在真实感、高清度、专业性以及文字响应上,表现出了惊人的突破。

据官方介绍,即梦3.0最大的亮点是:影视质感,文字更准,直出2k高清图。

话不多说,小编这就来一手实测对比,看看它与GPT-4o相比,谁会更胜一筹呢,同时也可以让大家更直观感受即梦3.0版本的突破。

另外需要注意的是,即梦3.0暂时还无法使用“导入参考图”生成图片。

那么,小编先使用大家最熟悉的GPT-4o同款提示词。

GPT-4o:“坏了,这波好像是我冲来的。”


提示词:


用手机拍摄的玻璃白板的广角图像,位于俯瞰海湾大桥的房间里。视野显示一名女性正在写作,她穿着一件带有大型 OpenAI 标志的 T 恤。笔迹看起来很自然,有点凌乱,我们看到了摄影师的倒影。文本写道:(左)”Transfer between Modalities:Suppose we directly modelp(text, pixels, sound) [equation]with one big autoregressive transformer.Pros:* image generation augmented with vast world knowledge* next-level text rendering* native in-context learning* unified post-training stackCons:* varying bit-rate across modalities* compute not adaptive”(右)”Fixes:* model compressed representations* compose autoregressive prior with a powerful decoder”On the bottom right of the board, she draws a diagram:”tokens -> [transformer] -> [diffusion] -> pixels”.


GPT-4o

即梦3.0

即梦2.1

小编还将提示词中的“OpenAI”换为了“即梦”,他也能准确生成。


并且小编发现,即梦3.0版本在生成中文表现更好,如图:



提示词:


创作一幅逼真的图像,描绘两个20多岁的女巫(一个灰发挑染,一个拥有长波浪栗色头发)正在阅读一个路标。背景:纽约威廉斯堡的一条随机街道,街道上立着一根柱子,柱子上覆盖着无数详细的街道标志(例如,街道清扫时间、需要停车许可证、车辆分类、拖车规则),中间有几个荒谬的标志:“女巫不得在C区使用扫帚停车”和“魔法地毯装卸仅限(15分钟限制)以及“驯鹿停车需许可证(12月24日至25日)”。“违规者将被列入“淘气名单”。指示牌位于街道右侧。不要重复标志。标志必须是现实的。角色:一个女巫拿着扫帚,另一个女巫拿着卷起来的魔法地毯。她们在前景中稍微背对着镜头,头稍微倾斜,仔细检查着标志。从背景到前景的构图:街道+停放的汽车+建筑物+街道标志 +女巫。角色必须最靠近拍摄镜头。


GPT-4o

即梦3.0

即梦2.1

因字数限制,小编就将提示词由英文转换为了中文,可以看出即梦3.0在复杂提示词和遵循提示词的能力上与GPT-4o相比稍逊,例如,它并未生成“摄影师的倒影”等等。

但相较于即梦2.1版本,它的提升不是一星半点,虽然3.0版本在部分单词中还是会出现不稳定,但大部分内容还是非常准确的。

我们再来点简单的提示词,让它设计两张海报。


提示词:


3D立体字”疯狂星期四”悬浮在深红色背景前,字母缝隙露出炸鸡食材剖面。前景透明手机屏幕显示优惠弹窗”v我50即刻解锁”,背景光斑虚化成汉堡形状,侧逆光勾勒炸鸡桶轮廓,金属质感标题下方小字标注活动条款 。


即梦3.0

即梦2.1


提示词:


Switch2游戏主机悬浮在星空宇宙背景中,手柄按键化作霓虹光圈环绕,”即刻畅玩”立体发光字体倾斜45度,粒子光效从屏幕迸发,底部液态金属形成”Switch2震撼发售”渐变文字,未来科技感霓虹光效。


即梦3.0

即梦2.1


提示词:


电影海报,小丑站在台阶上,张开双臂,诡异的笑,正面,人物摄影,灰暗的氛围,顶部显示手写的文字“joker”。


即梦3.0

即梦2.1


提示词:


奥斯卡获奖电影海报设计,巨大的泼墨狂草书法字“异人之下”为主体的海报”和副标题“我的存在自有异义”,镭射闪电标记印章,海报底部是:2024-12-27 上映 ,导演和演员名单,极小的带兜帽的红衣连帽衫人群分散在毛笔笔触间行走,詹姆斯特瑞尔,弥散渐变,强烈的对比反差,东方美学,极简主义,大面积留白,禅意,神性,杰作,获奖作品,极致构图,电影光线,极致像素,高清出图,32K,HDR


即梦3.0

即梦2.1

可以看到,2.1版本在大字生成上没什么问题,但是到了副标题,就开始出现BUG。而3.0版本的副标题更加稳定,并且,设计感、准确性更加优秀。

除了文字生成能力提升之外,在影视级的画面表现上,即梦3.0也表现出了不俗的实力。


提示词:


摄影写真 慢门摄影 王家卫电影感 抽帧摄影 慢门摄影 创意人像摄影 青橙色调 港风街拍摄影 地铁站 人来人往 光线虚化模糊 形成模糊的拖影 柔焦摄影 深邃迷离的眼神 艺术氛围感




提示词:


宇航员特写,被花朵包围,光线,朦胧,迷幻,孤独世界,四周大面积留白,弥散渐变,层次感,噪点摄影,超现实主义美学,空灵,宝利来,胶片,如梦似幻。




提示词:


俯视,长焦镜头,一直泰迪熊孤独地坐在十字路口,天空中正下着倾盆大雨,边缘模糊,增加视觉冲击力。周围是大量行人穿过的模糊身影,动态美学,虚化效果,长距离拖影。胶片颗粒质感,电影感,阴天光线,雨天,电影般逼真,大师构图,超高清,最佳质量,精致细节,32K。




提示词:


近景拍摄,索尼镜头,一只布偶猫在雪地里奔跑,毛发浓密




提示词:


特写镜头,少女面部肩颈角度,温婉东方古典面容,眼神低垂,恬静沉思,柔和斜前光,细腻光影过渡,高挺鼻梁,饱满嘴唇,光滑肌肤,优美下颌线,蓬松深棕卷发,樱花花瓣,自然灵动,浅粉色旗袍,丝绸反光,虚化樱花花丛背景,朦胧工笔画笔触,柔和色彩过渡,大量圆形浅焦外光斑,梦幻氛围,飘近半透明花瓣,动态模糊,真实肌肤质感,清晰发丝细节,柔美光影,情感细腻。



最后,小编想说,虽然AI绘图越来越强,但这并不意味着设计师会被取代,反而小编认为,它更可能会成为设计师手中的利器。

设计师的核心价值在于创新力,而AI可以让许多重复的劳动一键实现,从而可以让设计师把更多精力,放在更高维度的思考上,助力他们创造出更优秀高效的作品。

另外,值得一提的是,有消息称,Midjourney v7也将马上来到,听说还带了AI视频大模型。

 

(文:AI先锋官)

欢迎分享

发表评论