当谷歌的新AI模型可以在1个H100上运行,这对英伟达意味着什么?
谷歌发布Gemma 3模型挑战英伟达AI硬件主导地位。该模型能在多种硬件平台上高效运行,减轻开发者对英伟达GPU的依赖,打破了其80%市场份额的垄断局面。
谷歌发布Gemma 3模型挑战英伟达AI硬件主导地位。该模型能在多种硬件平台上高效运行,减轻开发者对英伟达GPU的依赖,打破了其80%市场份额的垄断局面。
DeepSeek发布的萤火文件系统3FS专为AI训练中的模型批量读取样本数据场景设计,通过Direct IO和异步对齐的读取方式提高性能,减少了服务端的数据加载时间。
DeepSeek 在 OpenSourceWeek 开源了两项 AI 训练加速技术,包括 DualPipe 和 EPLB。DualPipe 通过双向计算与通信提升了训练效率;EPLB 则优化了 MoE 架构中的资源分配,显著提高 GPU 的利用率。
高盛亚洲团队下调全球服务器市场规模预期,部分AI服务器生产计划从2025年推迟到2026年。预计2026年交付量将显著增加,同时强调AI推理服务器市场将在2025年迎来更高热度。
文章概述了美国能源部预测的数据中心电力需求增长情况及AI服务器和用水量的增长。2023-2028年间数据中心电力需求预计增加2-3倍至325-580TWh,占比6.7%-12%;AI训练消耗将超过推理需求。同时,美国数据中心的直接用水量预计将从2023年的660亿升增长约2-4倍。