跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

路由策略改进

DeepSeek发布最新论文,5大杀手锏让大模型训练、推理暴涨

2025年5月16日11时 作者 AIGC开放社区

3
的论文。
主要从硬件架构和模型设计的双视角探讨如何在不牺牲性能的前提下实现更高效的大规模训练和推

分类 资讯 标签 InfiniBand GPUDirect Async、 MPFT、 RoCE交换机、 多平面双层胖树网络、 拥塞控制机制、 路由策略改进 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • commands.py中的migrate_knowledge_vector_database()函数解析
  • 想成为顶尖 1% 的 AI 工程师?赶紧学这 27 个 Python 库!爆肝推荐!
  • commands.py中的migrate_annotation_vector_database()函数解析
  • 小扎强挖的AI人才名单公布!华人主导Meta“超级智能实验室”,开打逆风翻盘局
  • Meta股价创新高!扎克伯格首次公开超级智能实验室

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×