图像编辑归档

Grok-4 的系统提示词

2025年7月11日8时作者 NLP工程化

Grok-4 是由 xAI 创建的助手，能够处理用户关于 X 的各种请求，包括分析用户和内容，并提供关于 xAI 产品和服务的信息。

2025年7月8日23时作者极市干货

归架构，通过将文本离散 Token 与图像连续 Token 融合，共同推动图像生成与视觉理解任务。

2025年6月12日8时作者极市干货

一个整合高分辨率对比语义编码器与多模态大模型的统一生成框架，仅用 2.7M 样本即支持图像理解、生成、编辑与感知等多种任务。

2025年6月8日11时作者路过银河AI

ComfyMind 是一种协作型 AI 系统，旨在实现稳健且可扩展的通用生成。它基于 ComfyUI 平台构建，并引入语义工作流接口（SWI）和搜索树规划机制来提高复杂生成工作流的稳定性和灵活性。

2025年5月25日8时作者 GitHubStore

BAGEL 是一个开源多模态基础模型，拥有70亿活跃参数，在标准多模态理解排行榜上超越了当前顶尖开源模型，并展示了高级编辑能力及扩展至世界建模的能力。

2025年3月14日8时作者开源星探

Google开源Gemini 2.0多模态生图功能，用户只需一句话即可对图片进行修改或创作，如换发色、闭眼、改变对象身份等，展示了生成式AI在图像编辑领域的巨大进步。

2024年12月25日20时作者开源AI项目落地

今天推荐的BrushEdit是由北京大学、腾讯、中国香港大学和清华大学联合发布的开源项目，其通过双分支修复模型实现基于提示词的图像编辑功能。

2024年12月20日14时作者机器之心

香港大学与Adobe联合提出UniReal图像编辑生成新范式，通过大规模真实视频数据学习变化规律实现高保真效果。支持定制化生成、指令编辑和物体插入等多种任务。