逼空英伟达!DeepSeek发布Janus-Pro,附部署教程

新年快乐!

DeepSeek今年的春节应该是在办公室过的。

原因很简单,一方面r1正在接受全球洪水般的流量访问;另一方面,在除夕当天,居然发布了一个多模态的Janus-pro。

和其他AI绘画大模型相比,Janus-Pro不同之处在于,它是业界首个理解-生成一体化架构的大模型。

所谓理解,在AI绘画圈一般叫反推,尽管之前有不少优秀的反推模型,但反推是反推,绘画是绘画,DeepSeek合二为一,大大降低了部署成本。

对于广大AI绘画爱好者来说,最方便的工具当然是ComfyUI。

发布后仅仅4小时,github就有人发布了Janus-Pro的ComfyUI节点。

我陆陆续续累计用了4个小时(中间还跑了200公里去吃年夜饭)调通了节点,并顺利出图。

事实上大约十分钟就应该能在ComfyUI上部署完毕,但我的ComfyUI出现了插件以来库冲突的bug,查找bug和修复对应插件耗时较多。

简单总结下:出图能力有限,大致是SD1.5的水平(毕竟7B太小了);反推非常强大。考虑到Janus-Pro是开源的,未来形成生态后有望赶超Flux(感觉有点难,像优秀的混元,虽然很强,但第三方模型比较少)。

一、插件安装地址

https://github.com/CY-CHENYUE/ComfyUI-Janus-Pro

秋叶启动器可以在版本更新处安装,ComfyUI桌面版可以通过ComfyUI Manager在线安装。

安装完毕后重启启动器。

二、工作流和节点介绍

1、模型安装

DeepSeek发布了一个1B版本,一个7B版本(1B反推比较快),可以很小的显存适用。我把两个模型打包放到网盘,下载后都拷贝到安装路径即可

安装路径:

ComfyUI\models\Janus-Pro

网盘下载:

https://pan.quark.cn/s/a6fb4b706df2

2、工作流

插件作者把出图和反推放到了一个工作流上,在实际使用过程中,一般是分开的。

我把工作流拆成两个,方便不同场景使用。

出图工作流:

反推工作流:

三、效果评价

出图效果无法和Flux甚至SDXL对比,不过考虑到SDXL的原生模型也是稀烂,后续如果有第三方大模型涌现,有可能成为AI绘画爱好者的一支强大力量,所以期待生态能成长起来。

不得不说,反推太好用了。

比如:

The image depicts a woman standing by a body of water, with a serene and picturesque background of mountains and greenery. She is wearing a beautiful red off-shoulder gown with intricate gold embroidery on the waistband. Her hair is styled elegantly, adorned with a red floral hair accessory that complements her outfit. The overall scene exudes a sense of calm and natural beauty.

(这幅画描绘了一位女子站在水边,背景是宁静而如画的群山和绿地。她身穿一件美丽的红色露肩长裙,腰带上饰有精美的金色刺绣。她的头发优雅地盘起,佩戴着一朵红色的花卉发饰,与她的服装相得益彰。整个画面散发着一种宁静与自然之美。)

基本上描述了所有细节,可以直接拿来用了。

缺点是不能很好的识别人物,不能直接认出名字,毕竟7B模型还是太小了。

网盘下载(含工作流):

https://pan.quark.cn/s/a6fb4b706df2

(文:路过银河AI)

欢迎分享

发表评论