NB,豆包一口气给我画了20个分镜,还能保持一致性


今天,打开豆包网页版,无意间发现他们的绘图新功能上线了,叫“豆包CreationAgent v1.0 Beta”。


Beta版也就是测试版的意思,相较之前的图片3.0有了进一步升级。不仅更懂你的意图,还能通过多模型协作,批量出分镜图。


体验了一下午,贼NB,最多可一次性出图20张,还能保持超强的一致性。


比如,输入Prompt:

生成20个中国城市的知名地标建筑图。航拍视角,背景是该城市的知名地标建筑,2k。图片右上角用小字标注城市名和建筑名。比例9:16。


跟豆包的同学打听了下,这个功能目前正在灰测中。如果被灰到了,侧边栏会出现“智能升级”的提示。如果没有被灰到,建议再等等。


目前,只能在豆包网页版和豆包电脑版体验。


show case


先给大家看一些我跑的case,成功率还是比较高,少部分跑了2-3次,大部分都是一次生成。如果跑了2-3次都没有成功,建议改提示词,或者重新设计创意思路。


图片风格为「水墨画」,创作草船借箭的故事分镜,10张分镜图,保持风格一致。统一比例 「16:9」。


为它换上20种不同的服装,可以改变姿势。


你来设计一个老年蝙蝠侠的故事,风格用DC漫画的风格,主要讲超级英雄落幕的故事,8张,比例 「4:3」。


帮我生成10张连续性的童话绘本,关于狐狸、猫和老鼠相遇的童话故事。故事要有连贯性,角色不说话,纯粹使用动作来表达交流。


生成类似风格的漫画,至少5张以上


这几张效果非常Nice,豆包对参考图的画面内容和画面风格的理解非常准确。


用多张图片,给我讲解下回锅肉的制作步骤。


画一个人emo了。


学习这张图片的创意,生成10张充满寓意的微摄影图片。


这几张图的效果真的太棒了。


生成12张词语的词条表情包,诙谐荒诞的扁平插画,风格和格式保持风格统一,不用解释词的意思,只是对文字做适当的变形来符合文字的意义。比如“内卷”这个词是卷曲的,“躺平”这个词是扁平的。


制作《少年闰土》的分镜图,浓烈的版画风格。线条流畅,细腻纹理,黑白对比,极简主义,风格统一,比例 「16:9」。


一些总结


测了一下午,简单总结下。


豆包CreationAgent Beta版主要擅长:


  • 1)连续性多图生成。无论是分镜还是绘本,豆包都能稳定生成20张以内的图片(也可以通过“连续对话”生成超过20张的图片),且都能保持一定的一致性,人物、场景、风格一致。


  • 文生图,能生成上十张连续图不崩,真的不易。


  • 据介绍,这源于豆包采用了智能代理技术,通过调用多个模型来协作完成。所以这个版本被命名为“DOUBAO CreationAgent v1.0Beta”。


  • 2)意图理解进一步增强。即使用户的提示词不够精确,豆包依然能够理解其意图,生成符合用户期待的高质量图片。


  • 3)可将草图具象化。无论是多么抽象的草图、概念图,豆包都能将其具象视觉。


这是我画的一个关于山脉的草图,按照你的构思,帮我生成一张图片。图片风格为「水墨画」。


卧槽,豆包画的图是真好。没想到,我这张垃圾草图也有用武之地。


不过,在我测的过程中,也发现豆包还存在一些问题。建议大家在使用过程中注意。


  • 1)对于多图生成,建议添加“保持风格统一”prompt,约束其一致性。


  • 2)人像较难保持一致性,建议不用真实人像的脸部来作为参考图。


  • 3)绘本创作,你可以让豆包先生成一个人物特点介绍的描述,然后用这段描述来固定分镜的主体人物,这样可以提升主体一致性。


  • 4)偶尔二次修改,豆包不工作,建议手动@出图像生成,保持在图像生成技能下使用。


写在最后


两个多周前,即梦3.0图片模型悄然更新,给设计行业带来了巨大的冲击。


很多人还没有完全玩会即梦3.0呢,如今豆包又带着全新的CreationAgent v1.0 Beta来了。用嘴改图,连续生图,生绘本,生分镜,给草图上色……


不得不说,在绘图这块,即梦&豆包越走越远。虽然还有一些缺陷,但在国产AI绘图里,已经是其他模型/产品的天花板。


而且,据豆包的同学透露,即梦近期正在密集内测视频3.0


豆包CreationAgent生图+即梦视频3.0生视频,这下真的无敌了。



(文:沃垠AI)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往