阿里最新多模态统一理解与生成模型:Qwen VLo,图片理解生成能力更强。Qwen VLo在原始多模态理解与生成能力基础上进行了升级,增强了对图像的理解深度,生成更准确,一致性更强。
-
可以生成图像、编辑再创作图像、生成海报、组合物体等
-
后面它还会上线多图输入、极端长宽比图像生成功
-
支持开放指令编辑生成,可以说“给这张图片添加一个晴朗的天空”
-
支持中、英文
-
目前放出的是预览版本,可在Qwen Chat体验


参考文献:
[1] 体验地址:https://chat.qwen.ai/
[2] 博客: https://qwenlm.github.io/blog/qwen-vlo/
知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。
(文:NLP工程化)