项目简介
OmniControl:物品驱动的图片生成
提供素材图,生成的图片中融入素材图中的主体。融合效果还行,图片效果一般。
特征
OminiControl 是一个最小但功能强大的通用控制框架,适用于FLUX等扩散变压器模型。
-
Universal Control 🌐 :统一的控制框架,同时支持主题驱动控制和空间控制(例如边缘引导和修复生成)。
-
最小设计🚀 :注入控制信号,同时保留原始模型结构。仅在基础模型中引入了 0.1% 的额外参数。
快速开始
设置(可选)
-
环境设置
conda create -n omini python=3.10
conda activate omini
-
要求安装
pip install -r requirements.txt
使用示例
-
主题驱动生成:
examples/subject.ipynb
-
修复:
examples/inpainting.ipynb
-
Canny 边缘到图像、深度到图像、着色、去模糊:
examples/spatial.ipynb
Gradio应用程序
要运行 Gradio 应用程序以进行主题驱动生成:
python -m src.gradio.gradio_app
主题驱动生成指南
-
输入图像会自动进行中心裁剪并调整大小至 512×512 分辨率。
-
撰写提示时,请使用诸如
this item
、the object
或it
之类的短语来指代主题。例如 -
该物品的特写视图。它被放置在一张木桌上。
-
一位年轻女士穿着这件衬衫。
-
由于训练中缺乏人类数据,该模型目前主要适用于物体而不是人类受试者。
项目链接
https://huggingface.co/spaces/Yuanshi/OminiControl
https://github.com/Yuanshi9815/OminiControl
扫码加入技术交流群,备注「开发语言-城市-昵称」
合作请注明
关注「GitHubStore」公众号
(文:GitHubStore)