一句话P图:ComfyUI OmniGen2 原生工作流
Flux Kontext dev实现了一句话P图自由,ComfyUI更新了OmniGen2工作流。OmniGen2是一个7B参数量的强大模型,支持文本生成图像和基于指令的图像编辑。
Flux Kontext dev实现了一句话P图自由,ComfyUI更新了OmniGen2工作流。OmniGen2是一个7B参数量的强大模型,支持文本生成图像和基于指令的图像编辑。
新智元报道
莱斯大学、约翰霍普金斯大学以及英伟达的研究人员提出了一种新的AI训练范式ViGaL,通过让7B参数的多模态模型玩简单街机游戏来培养其跨领域的推理能力。研究发现,这种模型不仅在复杂的数学和几何任务上超过了GPT-4o等顶级闭源大模型,还保持了较强的通用视觉能力。
Liquid 是一款由字节跳动、华中科技大学和香港大学联合开源的强大模型,能无缝集成视觉理解与生成能力。其7B参数的多模态大语言模型基于离散编码技术,能够实现统一处理图像、文字输入输出,表现出色的视觉理解和强大的图像生成功能。