DeepSeek 开源周第四弹:双向流水并行与专家并行负载均衡器!一次开源三个项目!
DeepSeek开源周第四弹来了!他们发布了DualPipe、EPLB两个新组件以及训练和推理框架的性能分析数据。DualPipe通过双向流水线提高计算效率,EPLB则实现专家并行负载均衡,共同提升模型在不同GPU之间的协同表现。
DeepSeek开源周第四弹来了!他们发布了DualPipe、EPLB两个新组件以及训练和推理框架的性能分析数据。DualPipe通过双向流水线提高计算效率,EPLB则实现专家并行负载均衡,共同提升模型在不同GPU之间的协同表现。
Claude在不到5分钟内成功将一个27年前的VB4 EXE文件转换为Python版本,并恢复了其功能,展示了AI在软件考古和代码迁移方面的潜力。
云天励飞创始人郑文先介绍了边缘AI技术在落地和应用中的优势,并强调了中国在算法芯片化方面的发展潜力。他提到DeepSeek的成功预示着边缘AI时代的到来,深圳拥有雄厚的电子信息基础和众多优质AI企业,但不必为此感到焦虑。
本文介绍了五个AI工具包和模型,包括olmOCR用于处理PDF文档、DeepGEMM优化FP8矩阵乘法、R1-OneVision多模态大语言模型、Baichuan-Audio语音交互模型以及MyCoder AI编程工具。
万众瞩目的英伟达发布2025财年第四季度财报,营收和净利润均创历史新高。数据中心业务成为主要收入来源之一,黄仁勋强调Blackwell的市场潜力及架构优势。DeepSeek引发关注,但并未完全削弱投资者对英伟达的信心。英伟达对未来增长持乐观态度,但仍需面对市场波动的风险。
机器人开放社区报道:源升智能获数千万元天使轮融资,深创投领投,主要用于加速新一代机器人灵巧手及高性能触觉传感器系统的研发。公司致力于为行业提供可靠稳定的硬件开发平台。
石头科技在上海天文馆举办发布会,推出了多款智能清洁产品,包括全球首创的G30 Space探索版扫地机器人和A30 Pro Steam洗地机,展示了五轴仿生机械手、三线结构光避障等创新技术,旨在引领智能清洁行业的新风向。
DeepSeek 在 OpenSourceWeek 开源了两项 AI 训练加速技术,包括 DualPipe 和 EPLB。DualPipe 通过双向计算与通信提升了训练效率;EPLB 则优化了 MoE 架构中的资源分配,显著提高 GPU 的利用率。