最近DeepSeek火爆出圈,我也优化了我的ComfyUI跑图工作流,通过配置API,实现了DeepSeek自由。
对于AI绘画来说,DeepSeek都有哪些用途呢?
主要有三个。
一、优化提示词
随着AI绘画技术的不断迭代,大模型对自然语言的理解越来越容易,之前我曾经参与创作的一些提示词插件已经没有太大必要了。
但是对于绝大多数AI绘画爱好者来说,能把一幅画面表述清晰(尤其是用英语),也是一件困难的事。
如果提示词过于简单,AI绘画大模型无法发挥最佳作用,画出来的画面单调乏味。
这个时候,可以让DeepSeek丰富细节。
data:image/s3,"s3://crabby-images/21ce8/21ce88a22239f9cfd142cc435bcb3fd09d084724" alt=""
举个例子,我能想到的关于画面的表述,非常“贫瘠”:
红色裙子,雍容华贵,高跟鞋,性感。
DeepSeek补充的细节就非常丰富了:
Asuka, wearing a stunning red dress that exudes elegance and sophistication, the fabric flowing gracefully with every movement, the deep crimson hue accentuating her radiant beauty, high heels adding a touch of allure and height, her posture confident and poised, the dress hugging her figure perfectly, highlighting her curves in a tasteful and sensual manner, the overall look is both regal and captivating, with intricate details like delicate lace trim and subtle shimmering embellishments catching the light, her hair styled in soft waves cascading over her shoulders, her makeup subtle yet striking, with a bold red lip that complements the dress, the background suggesting a luxurious setting, perhaps a grand ballroom or a chic urban rooftop, the atmosphere rich with a sense of glamour and mystery, perfect for an AI-generated painting that captures the essence of timeless beauty and modern allure.
data:image/s3,"s3://crabby-images/bc69b/bc69b5edf3904a525bbd3d68e2b363be132e3757" alt=""
二、反推
DeepSeek的v3和r1目前是没有反推(多模态识别)功能的,DeepSeek推出了一个开源的Janus Pro,是支持反推的。
实事求是的讲,Janus Pro和其他反推类模型相比并没有特别明显的优势。但它整合了反推和生图,并提供了1B和7B两个模型,未来生态会比较好。
只是反推的话,1B的模型即可,可以节约大量显存。
三、翻译
如果英文水平一般化,在使用AI绘画大模型的时候,还会遇到语言的转换问题。
除了混元等个别国产大模型外,绝大多数大模型只认识英文。
如果是反推来的提示词、别处粘贴来的提示词,想要看一看什么内容的话,可以用DeepSeek进行翻译。
data:image/s3,"s3://crabby-images/181e9/181e9a2540f6fa514ff5f4fbb65ca845f2b7edd7" alt=""
为了方便创作,我甚至让DeepSeek翻译完了再附上原文,并生成TXT文档。
四、配置DeepSeek节点
之前的文章里,我推荐了一个DeepSeek的ComfyUI插件,支持API,不过如果把大模型换成硅基流动等非官方地址,就无法配置。
我试了下ComfyUI LLM Party插件,可以支持硅基流动以及其他第三方DeepSeek模型,当然了,它几乎支持包括ChatGPT在内的所有常见大模型,甚至还支持本地配置的大模型。
插件下载地址:
https://github.com/heshengtao/comfyui_LLM_party
使用DeepSeek API的话,该插件核心有两个节点。
一个是API参数配置,API LLM加载器。
以硅基流动为例,model_name 输入 deepseek-ai/DeepSeek-V3 (建议用V3,不要用r1,对于AI绘画来说,V3足够用了,还省钱)。
base_url 输入:https://api.lsiliconflow.cn/v1
api_key:输入硅基流动的api即可。
data:image/s3,"s3://crabby-images/5e798/5e798e6f881e5a7d62c498b90ee0067e7dfd20dd" alt=""
五、硅基流动等第三方DeepSeek的API获取
最近开放API的第三方DeepSeek非常多,越来越便宜,以硅基流动为例(其他的大同小异),找到API密钥,创建一个新密钥,可以获取API Key。
data:image/s3,"s3://crabby-images/3e5cd/3e5cd55d9846c032a6a057071f2810f751b11100" alt=""
参考工作流下载:
https://pan.quark.cn/s/644469719437
(文:路过银河AI)