跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

Diffusion Models

2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程

2025年6月12日16时 作者 机器之心

本文介绍了一种名为ArtiScene的方法,通过将文本生成图像技术与3D重建技术结合来自动化生成高质量的3D场景。

分类 学术、 资讯 标签 ArtiScene、 Diffusion Models、 GPT模型、 康奈尔大学、 自动化流程、 顾泽琪 发表评论

生成理解统一模型解读 (四):JanusFlow:使用 Rectified Flow 做生成的 Janus

2025年5月8日23时 作者 极市干货

解统一架构 Janus 的后续版本,借助 Rectified Flow 做生成。
>>
加入极市CV

分类 学术 标签 Diffusion Models、 Rectified Flow、 Transformer、 数据增强、 训练效率、 高分辨率图像生成 发表评论

7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

2025年4月5日16时 作者 机器之心

型来生成。在生成模型发展早期,这种刻板印象广泛存在于很多研究者的脑海中。
但最近,这种印象正被打破。

分类 学术、 资讯 标签 Countdown、 Diffusion Models、 任意顺序生成、 数独、 规划任务、 质量-速度权衡 发表评论

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub Google GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 近期代表性开源大模型梳理:Decoder转Encoder-Decoder、多模型组合新趋势
  • RAG-Anything:PDF、表格、公式全能读!港大开源神器让AI真正理解复杂文档?
  • MCP Toolbox 新范式:为 AI Agent 提供解耦、可控的数据库访问能力
  • 关于Pingpong和Cooperative的一些感性理解
  • 企业级智能体开发中所遇到的问题以及解决方案

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×