阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95%
阿里通义团队提出的新范式PARSCALE通过扩展CFG的双路径到P条并行路径,显著提升了1.6B模型的性能,仅占用后者的1/22内存,并将延迟增加量减少至1/6。该方法无需从头训练现有模型(如Qwen-2.5),并在GSM8K数学推理任务中实现了34%的性能提升。
阿里通义团队提出的新范式PARSCALE通过扩展CFG的双路径到P条并行路径,显著提升了1.6B模型的性能,仅占用后者的1/22内存,并将延迟增加量减少至1/6。该方法无需从头训练现有模型(如Qwen-2.5),并在GSM8K数学推理任务中实现了34%的性能提升。
大模型在全新数独基准Sudoku-Bench上的表现不尽如人意,总体正确率低于15%,即使是高性能模型也仅能取得2.9%的正确率。研究团队认为这反映了现有基准测试的问题:大模型容易依赖记忆而非逻辑推理。Sakana AI推出的新基准挑战了这一点,包含复杂且需要多步骤推理的变异数独谜题,展示了AI在创造性和多层次推理上的局限性。
一加Ace5至尊系列发布,配备「电竞三芯」(天玑9400+、灵犀触控芯和电竞Wi-Fi芯片),最高安兔兔跑分3225260,在《王者荣耀》等游戏中的表现优异。此外还提供高刷护眼屏、冰河散热系统等多项改进,旨在提升游戏体验。
2025年初,DeepSeek发布超级大模型引发开源热潮,随后OpenAI推出价格战组合拳和多模态模型。新智元作为头部媒体联合视频号推出《10分前沿科创季》快速追踪全球AI动态。
蚂蚁发布的大模型开源生态全景图涵盖19个技术领域、135个项目,揭示了大模型开发生态的演进规律和当前趋势。报告指出模型训练框架、高效推理引擎和低代码应用开发框架是主导赛道,并分析了智能体开发方式的变化及标准化协议的重要性。
Meta决定重组AI团队以应对人才流失、竞争对手压力和技术停滞等问题,旧研发体系被拆分为AI产品团队、AGI基础团队和AI研究部门,Yann LeCun领导的FAIR团队仍保持独立。Llama系列面临翻车及跳票问题,外部人才持续流出影响Meta的研发节奏。
北京大学董豪老师课题组提出DexGarmentLab仿真平台和HALO泛化策略,解决柔性衣物操作中的数据依赖、物理真实性不足及算法泛化能力弱等问题。
全球首款实时摄像头AKOOL Live Camera发布,实现虚拟数字人、多语言翻译、换脸和动态视频生成功能。其超低延迟和智能交互能力打破行业纪录,有望重塑AI视频创作模式。