CVPR2025|突破数据瓶颈!Stable Diffusion 助力视觉异常检测,无需训练即可生成真实多样异常样本
本文介绍了一种名为AnomalyAny的创新框架,利用Stable Diffusion生成能力仅需单个正常样本和文本描述即可生成逼真且多样化的异常样本,解决了视觉异常检测中异常样本稀缺的问题。
本文介绍了一种名为AnomalyAny的创新框架,利用Stable Diffusion生成能力仅需单个正常样本和文本描述即可生成逼真且多样化的异常样本,解决了视觉异常检测中异常样本稀缺的问题。
Lovart 是全球首个设计 Agent,可以让人类和 AI 在同一张画布上协作创作。它提供了丰富的功能来生成符合需求的视觉效果,并支持多城市主题插画的制作。
本文介绍了一种基于生成流网络的扩散模型奖励微调方法Nabla-GFlowNet,该方法能够在快速收敛的同时保持生成样本的多样性和先验特性。通过在Stable Diffusion上实验验证了其有效性。
Midjourney推出的新版V7注重图像的真实感提升,并在细节真实性、场景理解及专业拍摄风格适配方面进行了优化。但个性化创作受限于数据学习和用户满意度提高有限问题。同时,新增的草图模式提升了生成速度,但也带来了一些质量上的挑战。
AI Toolkit 是一款开源工具包,专注于Stable Diffusion模型训练,提供优化的训练脚本、FLUX.1训练方案、多平台支持以及可视化操作界面等特性。
中国研究员联合DeepMind团队提出的新研究《Lavender: Diffusion Instruction Tuning》,通过“注意力对齐”让Stable Diffusion教Llama-3.2等模型“看图说话”,性能提升30%,且代码、模型、训练数据将全部开源。
一款名为1Prompt1Story的开源项目解决了角色一致性问题,适用于文生图模型生成角色一致性的场景。它能自动生成长提示词,并利用先进技术确保角色在多个图像中的统一性,支持漫画、小说插图和游戏角色设计等多领域。
OpenAI 推出 Sora 视频生成模型,支持用户创建最长 20 秒超现实视频内容。目前对公众开放使用,但注册功能暂时无法使用。Sora 被整合进现有的订阅服务中,并将免费提供给 Plus 用户。