对提示词的理解差异：Illustrious和Pony

众所周知，开源AI绘画现在已经进入了Flux时代，几乎所有优秀的AI画面都来自于Flux。

尤其是在真人风格领域，Flux几乎堪比单反相机，效果非常惊艳。

不过，依然有很多AI模型创作者和AI绘画爱好者“停留”在SDXL时代，尤其是Illustrious和Pony，不断的推陈出新。

原因有两个，一是相当一部分AI绘画爱好者的显卡不够强大，无法很好的跑的动Flux；二是Illustrious和Pony依然有不可替代的优势，比如近乎完美的身体（luo），比如对身体姿态的控制。

最近Illustrious系列特别受欢迎，它的身体姿态控制性要优于Pony系列。

但是，我在测试中却发现一个有意思的点：同一个系列之间，对提示词的理解能力是不同的（以前没料到）。一部分Illustrious对提示词的理解，要远逊于Pony。

这是怎么回事呢？

我想大概是训练素材不够充分导致的。

下面做一个测试对比，选用常见的几个Illustrious和Pony的模型。

主要参数：

20步，CFG=6，采样器=euler，图片尺寸 1024*768

正面提示词：

(2girls, a photo of two pretty student girls), age 18, (blonde hair), wearing casual outfits,shirtlift, flashing tits, underboob, shy, nervous, eye contact, looking at another, indoors, inside a cafe shop with some customers around, (realistic, photorealistic),upper body,(head and shoulders closeup:1.2), detailed face, detailed skin with visible pores, detailed background, ((best quality, masterpiece)),RAW photo,8k,soft lighting,high quality,sharp focus on subject,film grain,

（两名18岁的漂亮女学生，金发，穿着休闲装，掀衬衫露出胸部，露出乳沟，显得害羞和紧张，有眼神交流，互相看着对方，场景在室内，是一家咖啡店，周围有其他顾客。画面风格写实、逼真，聚焦于上半身，特写头部和肩膀（特写比例1.2），面部细节丰富，皮肤上有清晰的毛孔，背景也十分细致。整体质量最佳，堪称杰作，是RAW格式照片，8K分辨率，柔和的光线，高质量，主体对焦清晰，带有胶片颗粒。）

负面提示词：

low quality,ugly,deformed,bad anatomy,extra fingers,censored

（需要注意的是，因为提示词比较性感，Pony很容易跑出少儿不宜，本文只截取可以放出来的图）

1、Illustrious系列，红潮，redcraftCADSUpdatedJan18_2relustionIL

（事实上我正是在测试这个模型的时候发现了异常，对提示词不敏感）

掀衬衫、其他顾客的信息没有了。

2、llustrious系列，thrillustrious_v40ImprovedVAE

这个比较接近原意了，但依然没有其他顾客。

3、llustrious系列，vauxzMerge25D3D_illuVSarah

这是我非常喜欢的2.5D模型，非常接近原意，但还是没有其他顾客。

4、llustrious系列，noobaiXLNAIXL_vPred10Version

稍微抽象一点。

5、Pony系列，waiSHUFFLENOOB_v10

6、Pony系列，cyberrealisticPony_v7

这个咖啡店有人了，但俩人没有对视。

7、最后我用Flux的iniverseMixXLSFWNSFW_flux1DNsfwFp16V12生成了一张，基本上所有意思都有了。

结论，还是Flux对提示词的理解更完整。

（文：路过银河AI）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

《对提示词的理解差异：Illustrious和Pony》有1条评论

发表评论取消回复

《对提示词的理解差异：Illustrious和Pony》有1条评论

发表评论 取消回复

发表评论取消回复