360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能
中等量级推理模型Tiny-R1-32B-Preview亮相,仅以5%参数量逼近DeepSeek-R1巨兽。该模型在数学、编程和科学领域表现突出,并承诺开源技术。
刚刚,DeepSeek开源MoE训练、推理EP通信库DeepEP,真太Open了!
DeepSeek 开源首个用于MoE模型训练和推理的EP通信库 DeepEP,优化高效通信和并行处理,支持FP8精度,并提供灵活资源调度。
DeepSeek 开源 DeepEP 高效通信库,专家并行不再是难题!
DeepSeek OpenSourceWeek 发布了首个面向MoE模型的开源EP通信库 DeepEP。它提供了高性能All-to-All通信内核、集群内和集群间全面支持,以及训练和推理预填充及推理解码低延迟内核等特性。性能测试显示其在不同场景下都能提供出色的通信性能。
承认低估阿里,大摩:AGI目标下,阿里云收入三年将翻倍,估值能给1400亿美元!
大摩上调阿里巴巴评级至‘超配’,目标价从100美元上调至200美元。预计阿里云收入三年内翻倍,EBITDA利润率将提高到约35%。基于乐观预期,阿里的分拆估值为每股200美元,其中云业务估值为每股60美元,使得阿里云市值达到1400亿美元。