图像编辑
2.7M 样本即可同时支持图像理解、生成等多种任务!北大团队开源统一大模型UniWorld-V1
一个整合高分辨率对比语义编码器与多模态大模型的统一生成框架,仅用 2.7M 样本即支持图像理解、生成、编辑与感知等多种任务。
Liblib AI上线Kontext,门槛大幅降低!藏师傅手把手教你用它解决图片问题
FLUX 的 Kontext 应用教程介绍,涵盖基本修改、多图融合及放大处理等内容,并提供了详细的 Liblib 使用指南。
港科大和字节跳动:开源自然语言P图框架ComfyMind
ComfyMind 是一种协作型 AI 系统,旨在实现稳健且可扩展的通用生成。它基于 ComfyUI 平台构建,并引入语义工作流接口(SWI)和搜索树规划机制来提高复杂生成工作流的稳定性和灵活性。
2天1k多星!BAGEL横空出世:字节跳动发布全球首个多模态全能AI,开启智能新纪元!
BAGEL 是一个开源多模态基础模型,拥有70亿活跃参数,在标准多模态理解排行榜上超越了当前顶尖开源模型,并展示了高级编辑能力及扩展至世界建模的能力。
一句话实现改图功能,谷歌Gemini 2.0新功能上线!
文章介绍了Gemini 2.0 flash experimental的主要功能包括图像编辑、一键生成文字和配图以及图片定制等内容,强调了其在图像处理方面的巨大进步,并指出尽管存在一些瑕疵,但仍对未来充满信心。
Gemini 2.0的“用嘴改图”终于上线了,这是AI绘图的新范式。
Google开源Gemini 2.0多模态生图功能,用户只需一句话即可对图片进行修改或创作,如换发色、闭眼、改变对象身份等,展示了生成式AI在图像编辑领域的巨大进步。
创新!腾讯、北大、清华、港大联合开源BrushEdit,通过提示词AI自动完美修改编辑图片。
今天推荐的BrushEdit是由北京大学、腾讯、中国香港大学和清华大学联合发布的开源项目,其通过双分支修复模型实现基于提示词的图像编辑功能。
UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律
香港大学与Adobe联合提出UniReal图像编辑生成新范式,通过大规模真实视频数据学习变化规律实现高保真效果。支持定制化生成、指令编辑和物体插入等多种任务。