清华系 AI 公司面壁智能完成新一轮数亿元融资,CEO 李大海:大模型将从大跃进转向持久战

面壁智能获得数亿元融资,龙芯创投等领投。公司将进一步提速高效大模型商业化布局,提供端侧智能解决方案,并在法律、教育等领域有所建树。李大海表示,公司将保持竞争力并在端侧智能领域建立市场地位。

清华&面壁开源高效压缩技术:一块 80 G A100 轻松加载 50 个 7B 模型

清华大学与面壁智能团队提出Delta Compression技术,通过存储主干模型与任务专用模型之间的参数差值显著降低模型对显卡的存储需求。混合精度压缩方法Delta-CoMe进一步提升了模型推理效率和灵活性,支持多达50个7B模型加载在一块80G A100 GPU上,几乎不损失任务性能。