清华&面壁开源高效压缩技术:一块 80 G A100 轻松加载 50 个 7B 模型
清华大学与面壁智能团队提出Delta Compression技术,通过存储主干模型与任务专用模型之间的参数差值显著降低模型对显卡的存储需求。混合精度压缩方法Delta-CoMe进一步提升了模型推理效率和灵活性,支持多达50个7B模型加载在一块80G A100 GPU上,几乎不损失任务性能。
清华大学与面壁智能团队提出Delta Compression技术,通过存储主干模型与任务专用模型之间的参数差值显著降低模型对显卡的存储需求。混合精度压缩方法Delta-CoMe进一步提升了模型推理效率和灵活性,支持多达50个7B模型加载在一块80G A100 GPU上,几乎不损失任务性能。
清华大学智能产业研究院(AIR)与地瓜机器人联合发布RDK UniBots具身智能科教平台,支持从幼儿园到大学的教育需求。该平台以统一技术架构为基础,涵盖硬件和软件解决方案,并采用分层技术架构打通开发链路。
清华大学提出DiffGS生成式模型,实现无预处理三维高斯生成,支持多种任务如图生3DGS、文生3DGS等。该模型利用函数化方法表示三维高斯,并通过扩散生成式模型进行训练和生成。
UCSD和清华的研究团队提出了一种方法,通过外部科学工具提高AI在解决复杂问题时的决策准确率。该研究展示了训练模型在自定义数据集上显著优于基准模型,并且在不同难度问题上的工具使用表现最佳。
近期清华大学提出的新一代主动 Agent(ProActive Agent)交互范式,让AI从被动执行指令变为具备主动观察和判断环境、预见用户需求的能力。该技术已在行程安排、文件管理等领域实现应用,并通过数据集验证了其有效性。
月之暗面Kimi联合清华大学等机构开源大模型推理架构Mooncake,采用分阶段方式逐步实现高性能KVCache多级缓存的开源。该架构提升了Kimi用户体验,降低了成本,并为处理长文本和高并发需求提供了解决方案。
清华大学联合面壁智能团队提出新一代主动 Agent 交互范式,让 AI 成为具有’主观能动性’的智能助手。相比传统被动式 Agent,主动 Agent 能够根据上下文主动帮助用户。
清华大学魏朝晖团队发现噪声可导致量子优势突然消失的现象,并首次将其发表于Science Advances。研究揭示了量子信息处理中噪声对量子计算性能的显著影响,为量子纠错机制的应用提供了指导。
宾果智能宣布获得近亿元股权投资,主要用于技术研发和市场拓展。公司以智能机器人为核心产品与教育服务的人工智能公司,创始人闵海波为清华大学人工智能专业博士。
Janus团队提出了一种名为JanusFlow的新模型,该模型结合了预训练视觉编码器与MLM的方法以及基于Rectified Flow的生成框架,实现了统一的视觉理解和生成能力。通过将理解与生成任务分别配置专用编码器,并利用REPA方法加速生成训练,JanusFlow在多模态理解和生成任务上表现出色。