A100 归档 - 每时AI

美团基于SGLang提供INT8无损满血版DeepSeek R1部署方案

2025年3月6日19时作者 GiantPandaCV

.co/meituan/DeepSeek-R1-Block-INT8/tree/main/infer

2024年11月29日14时作者量子位

清华大学NLP实验室提出Delta-CoMe模型增量压缩技术，80G的A100 GPU可加载50个7B模型，节省显存约8倍。该方法结合低秩分解和低比特量化技术，显著提升复杂任务性能并兼顾效率，优于传统微调方法。

2024年11月26日13时作者 PaperWeekly

国内GPU租赁市场火爆，价格跳水。智星云算力服务平台作为一枝独秀的平台，拥有1000P自有GPU算力，技术实力强、服务可靠、数据安全有保障。