黄泽桓归档 - 每时AI

挖掘DiT的位置解耦特性，Personalize Anything免训练实现个性化图像生成

2025年3月25日16时作者机器之心

本文介绍了一种全新的架构设计 Personalize Anything，它能够在无需训练的情况下完成概念主体的高度细节还原，并支持位置控制和多种应用。通过创新的标记替换机制和特征扰动技术，团队展示了其在保真度、可控性和多功能性上的优势，并将其应用于布局引导生成、多物体组合等场景。

2025年3月14日12时作者机器之心

本文介绍了一篇关于 MIDI 模型的研究论文，MIDI 能够从单张图像生成高几何质量的组合式 3D 场景。该模型在多个数据集上的表现超越现有方法，并有望应用于建筑设计、虚拟现实等多个领域。