跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

RoCE交换机

DeepSeek发布最新论文,5大杀手锏让大模型训练、推理暴涨

上午11时 2025/05/16 作者 AIGC开放社区

3
的论文。
主要从硬件架构和模型设计的双视角探讨如何在不牺牲性能的前提下实现更高效的大规模训练和推

分类 资讯 标签 InfiniBand GPUDirect Async、 MPFT、 RoCE交换机、 多平面双层胖树网络、 拥塞控制机制、 路由策略改进 发表评论

AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4 GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克 黄仁勋

近期文章

  • 快讯津产首款人形机器人“天兵一号”亮相,武科大打造耐火材料智能砌筑机器人平台,00后团队创业半年获千万订单
  • 魔法原子再获数亿融资,推动千行百业落地
  • 新的AlphaGo时刻要来?谷歌推出“进化式”编程智能体,AI已学会设计高级算法!
  • “图片秒生”,腾讯混元图像2.0模型正式发布,主打速度和真实感
  • 腾讯混元发布首个毫秒级响应的实时生图大模型,主体一致度超高!!!

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×