谷歌最新AI芯片打平英伟达B200,专为推理模型打造,最高配每秒42500000000000000000次浮点运算

谷歌发布新款TPU v7芯片,峰值算力达4614TFlops,支持大规模并行处理和高效的内存访问。TPU v7在高带宽内存、低延迟ICN网络方面都有显著提升,并配备增强版SparseCore以支持高级排序和推荐工作负载。

剪枝60%不损性能!上海AI Lab提出高斯剪枝新方法,入选CVPR 2025

MaskGaussian团队提出了一种新的掩码技术,将掩码融合进光栅化过程,通过学习每个高斯点的掩码分布来优化渲染质量。在Mip-NeRF360、Tanks & Temples和Deep Blending三个数据集上分别剪枝了62.4%、67.7%和75.3%的高斯点,且性能损失可以忽略不计。

大模型一体机塞进这款游戏卡,价格砍掉一个数量级

英特尔锐炫™显卡搭配至强®W处理器的大模型一体机,性价比高且性能稳定,已在多个企业中实现落地应用。该方案能平衡成本与性能,简化运维并提供多样化选择,助力AI技术普惠到各行各业。

用梯度下降求解整数规划,中科大等提出无监督训练整数规划求解器新范式 ICLR 2025 Spotlight

中国科学技术大学王杰教授团队提出DiffILO方法,将整数线性规划转化为连续、可微且无约束的问题,并通过深度学习直接预测高质量解。该方法显著加快了训练速度,并生成更高质量的可行解。

阿里云造“Agent工厂”,百炼MCP服务上线,无需代码5分钟人人都可搭建Agent

AI大模型在企业市场落地新趋势:阿里云展示了AI质检能力,通过协同视觉专家小模型和通义千问VL大模型实现95%准确率的质检。同时,阿里云推出业界首个全生命周期MCP服务,简化了大模型转化应用的过程,满足不同场景需求。