U-Net和ViT凑一块,会发生什么?U-REPA:精准对齐Diffusion U-Net与ViT特征空间,训练提速42%
U-Net 架构对齐到 ViT(Vision Transformer)特征空间
的新方法
U-REP
U-Net 架构对齐到 ViT(Vision Transformer)特征空间
的新方法
U-REP
英伟达提出Laplacian Diffusion Models,这是一种受拉普拉斯金字塔启发的像素空间扩散模型,能够将图像拆分为不同频率成分并分别生成。该模型应用于文生图、超分辨率等任务,并通过U-Net网络实现。
DIAMOND是日内瓦大学和爱丁堡大学提出的一种新型强化学习智能体,能在由扩散模型构建的虚拟世界中高效学习各种任务。在Atari 100k基准测试中,其平均得分超越了人类玩家,尤其擅长处理复杂环境中的细节和决策。