跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

吞吐量提升

全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍

下午11时 2025/05/08 作者 新智元

队发了一篇万字技术报告:短短4个月,他们就让DeepSeek-R1在H100上的性能提升了26倍,吞

分类 资讯 标签 2K输入、 DeepSeek、 MTP条件、 NVIDIA Hopper、 SGLang、 吞吐量提升 发表评论

CVPR Oral 南京大学李武军教授课题组推出分布式训练算法UniAP,大模型训练最高加速3.8倍

下午4时 2025/04/30 作者 机器之心

为参与作者。
训练成本高昂已经成为大模型和人工智能可持续发展的主要障碍之一。
大模型的训练往往采用多

分类 学术、 资讯 标签 UniAP、 吞吐量提升、 国产 AI 计算卡、 显著提高训练效率、 策略优化时间缩短、 自动生成最优方案 发表评论

揭秘老黄演讲中关键技术:PD分离!UCSD华人团队力作,LLM吞吐量跃升4倍

下午4时 2025/03/19 作者 新智元

CSD全华人团队力作,创新性地提出预填充-解码分离技术。在严格的延迟约束下,相比现有最先进的服务系统

分类 资讯 标签 DistServe、 代码补全、 吞吐量提升、 大语言模型、 实时性、 聊天机器人 发表评论

PyTorch 原生FP8训练进展

下午10时 2025/01/08 作者 GiantPandaCV

PyTorch通过FSDP2、DTensor和torchao实现Float8训练提升吞吐量50%,展示了Float8在不同模型规模上的有效性,并进行了模型质量和评估基准验证。

分类 学术 标签 70B、 DTensor、 Float8、 FSDP2、 Meta LLaMa、 吞吐量提升 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 78%主创跳槽!Llama 14名作者只剩3人,Meta最强开源模型团队大溃散引争议
  • 阿里云发布通义灵码 AI IDE,深度适配千问 3 大模型、新增编程智能体,可调用 3000+ MCP 服务
  • 新版DeepSeek R1你得这样用,太爽啦~
  • 工业级耐用之选!盈连砂带机:耐磨抗造,多材质打磨一“机”搞定
  • AI之父Hinton:想知道不是最聪明物种的感觉?去问鸡吧

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×