跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

FID

解决 MAR 图像生成模型效率难题!LazyMAR:通过特征缓存加速自回归图像生成,效率无损提升2.83倍!

2025年6月23日23时 作者 极市干货

术,通过巧妙地利用特征缓存机制,成功攻克了MAR模型在计算效率方面的瓶颈,不仅实现了高达 2.83

分类 学术 标签 2.8倍、 64、 FID、 IS、 LazyMAR、 Token Cache 发表评论

通向世界模型关键一步:EX-4D来了,实现单目视频到自由视角生成

2025年6月18日11时 作者 机器之心

4D 场景和视频生成,致力于得到一种最佳的物理世界表示模型。其他作者均为 Pico MR 团队核心

分类 学术、 资讯 标签 DW-Mesh、 EX-4D、 FID、 Inpainting任务、 多视角生成、 极端物理一致性 发表评论

连续Token助力文本生成图像迈向新高度!Kaiming团队提出Fluid:MS-COCO上实现6.16 FID

2025年4月13日23时 作者 极市干货

比基于离散 token 的模型实现更好的视觉质量。
>>
加入极市CV技术交流群,走在计算机视觉的最

分类 学术 标签 FID、 Fluid模型、 GenEval、 MS-COCO、 参数量、 视觉质量 发表评论

纯 ImageNet 做文生图,我们能走多远?

2025年4月2日23时 作者 极市干货

据集,超过 SD-XL 的 T2I 模型。
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
太

分类 学术 标签 CAD-I、 Coverage、 DiT-I、 FID、 Precision、 Recall 发表评论

一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成

2025年3月31日16时 作者 新智元

新智元报道编辑:LRS 好困。研究提出SANA-Sprint,一种高效的蒸馏扩散模型用于超快速文本到图像生成,仅需1-4步即可在H100上实现7.59 FID和0.74 GenEval的先进性能,并支持实时交互式生成。

分类 资讯 标签 FID、 GenEval、 H100、 SANA-Sprint、 蒸馏扩散模型、 超快速生成 发表评论

李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了

2025年3月20日16时 作者 机器之心

说,它看到的是一个巨大的数字矩阵 —— 假设是一张 1000×1000 像素的彩色图片,实际上是一个

分类 学术、 资讯 标签 FID、 FlowMo、 Tokenization、 优化、 比特率、 重建图像 发表评论

自回归模型还能这么玩?kaiming团队:我们真的不需要矢量量化|自回归视觉生成模型系列解读

2025年3月19日23时 作者 极市干货

不是必需的。
>>
加入极市CV技术交流群,走在计算机视觉的最前沿
本文目录
1 MAR:不使用 V

分类 学术 标签 Diffusion Loss、 FID、 IS、 Mar 结构、 MATE、 MLP 去噪网络 发表评论

高呼「GAN 万岁!」的 R3GAN 做了哪些科研改进?

2025年1月23日23时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨天才程序员周弈帆
来源丨天才程序员周弈帆
编辑丨极市平台
极市导

分类 学术 标签 ConvNeXt、 DCGAN、 FID、 ImageNet-256、 R3GAN、 RpGAN 发表评论

NeurIPS 2024 Spotlight 轻微的预训练数据扰动如何造就更优秀的扩散模型

2025年1月9日23时 作者 极市干货

↑ 点击
蓝字
关注极市平台
作者丨王晋东
来源丨王晋东不在家
编辑丨极市平台
极市导读
适度的噪声

分类 学术 标签 CEP方法、 FID、 Qwen、 生成模型、 生成质量、 预训练 发表评论

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub Google GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • Meta将推出闭源模型,并砸数千亿美元打造超算集群
  • 东亚女性pony模型推荐
  • 同时处理蛋白质主链和侧链信息,斯坦福等基于消息传递神经网络实现全原子结构建模
  • 被谷歌24亿美元抛弃的Windsurf员工们终迎救星,Devin 团队出手完成教科书式收购
  • 关于Claude Code生态的一些项目

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×