对提示词的理解差异:Illustrious和Pony

众所周知,开源AI绘画现在已经进入了Flux时代,几乎所有优秀的AI画面都来自于Flux。

尤其是在真人风格领域,Flux几乎堪比单反相机,效果非常惊艳。

不过,依然有很多AI模型创作者和AI绘画爱好者“停留”在SDXL时代,尤其是Illustrious和Pony,不断的推陈出新。

原因有两个,一是相当一部分AI绘画爱好者的显卡不够强大,无法很好的跑的动Flux;二是Illustrious和Pony依然有不可替代的优势,比如近乎完美的身体(luo),比如对身体姿态的控制。

最近Illustrious系列特别受欢迎,它的身体姿态控制性要优于Pony系列。

但是,我在测试中却发现一个有意思的点:同一个系列之间,对提示词的理解能力是不同的(以前没料到)。一部分Illustrious对提示词的理解,要远逊于Pony。

这是怎么回事呢?

我想大概是训练素材不够充分导致的。

下面做一个测试对比,选用常见的几个Illustrious和Pony的模型。

主要参数:

20步,CFG=6,采样器=euler,图片尺寸 1024*768

正面提示词:

(2girls, a photo of two pretty student girls), age 18, (blonde hair), wearing casual outfits,shirtlift, flashing tits, underboob, shy, nervous, eye contact, looking at another, indoors, inside a cafe shop with some customers around, (realistic, photorealistic),upper body,(head and shoulders closeup:1.2), detailed face, detailed skin with visible pores, detailed background, ((best quality, masterpiece)),RAW photo,8k,soft lighting,high quality,sharp focus on subject,film grain,

(两名18岁的漂亮女学生,金发,穿着休闲装,掀衬衫露出胸部,露出乳沟,显得害羞和紧张,有眼神交流,互相看着对方,场景在室内,是一家咖啡店,周围有其他顾客。画面风格写实、逼真,聚焦于上半身,特写头部和肩膀(特写比例1.2),面部细节丰富,皮肤上有清晰的毛孔,背景也十分细致。整体质量最佳,堪称杰作,是RAW格式照片,8K分辨率,柔和的光线,高质量,主体对焦清晰,带有胶片颗粒。)

负面提示词:

low quality,ugly,deformed,bad anatomy,extra fingers,censored

(需要注意的是,因为提示词比较性感,Pony很容易跑出少儿不宜,本文只截取可以放出来的图)

1、Illustrious系列,红潮,redcraftCADSUpdatedJan18_2relustionIL

(事实上我正是在测试这个模型的时候发现了异常,对提示词不敏感)

掀衬衫、其他顾客的信息没有了。

2、llustrious系列,thrillustrious_v40ImprovedVAE

这个比较接近原意了,但依然没有其他顾客。

3、llustrious系列,vauxzMerge25D3D_illuVSarah

这是我非常喜欢的2.5D模型,非常接近原意,但还是没有其他顾客。

4、llustrious系列,noobaiXLNAIXL_vPred10Version

稍微抽象一点。

5、Pony系列,waiSHUFFLENOOB_v10

6、Pony系列,cyberrealisticPony_v7

这个咖啡店有人了,但俩人没有对视。

7、最后我用Flux的iniverseMixXLSFWNSFW_flux1DNsfwFp16V12生成了一张,基本上所有意思都有了。

结论,还是Flux对提示词的理解更完整。

(文:路过银河AI)

欢迎分享

发表评论