清华&面壁开源高效压缩技术:一块 80 G A100 轻松加载 50 个 7B 模型

清华大学与面壁智能团队提出Delta Compression技术,通过存储主干模型与任务专用模型之间的参数差值显著降低模型对显卡的存储需求。混合精度压缩方法Delta-CoMe进一步提升了模型推理效率和灵活性,支持多达50个7B模型加载在一块80G A100 GPU上,几乎不损失任务性能。

具身智能要从娃娃抓起,清华AIR联手地瓜机器人建立科教平台,从K12到大学科研都覆盖

清华大学智能产业研究院(AIR)与地瓜机器人联合发布RDK UniBots具身智能科教平台,支持从幼儿园到大学的教育需求。该平台以统一技术架构为基础,涵盖硬件和软件解决方案,并采用分层技术架构打通开发链路。

清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%

UCSD和清华的研究团队提出了一种方法,通过外部科学工具提高AI在解决复杂问题时的决策准确率。该研究展示了训练模型在自定义数据集上显著优于基准模型,并且在不同难度问题上的工具使用表现最佳。

清华、面壁提出创新AI Agent交互:能主动思考、预测需求

近期清华大学提出的新一代主动 Agent(ProActive Agent)交互范式,让AI从被动执行指令变为具备主动观察和判断环境、预见用户需求的能力。该技术已在行程安排、文件管理等领域实现应用,并通过数据集验证了其有效性。

清华&面壁开源新一代主动Agent交互范式!让AI从被命令到主动帮助

清华大学联合面壁智能团队提出新一代主动 Agent 交互范式,让 AI 成为具有’主观能动性’的智能助手。相比传统被动式 Agent,主动 Agent 能够根据上下文主动帮助用户。

清华量子计算成果登顶刊,首次发现噪声影响量子优势,来自丘成桐数学中心团队

清华大学魏朝晖团队发现噪声可导致量子优势突然消失的现象,并首次将其发表于Science Advances。研究揭示了量子信息处理中噪声对量子计算性能的显著影响,为量子纠错机制的应用提供了指导。

DeepSeek等团队新作JanusFlow: 1.3B大模型统一视觉理解和生成

Janus团队提出了一种名为JanusFlow的新模型,该模型结合了预训练视觉编码器与MLM的方法以及基于Rectified Flow的生成框架,实现了统一的视觉理解和生成能力。通过将理解与生成任务分别配置专用编码器,并利用REPA方法加速生成训练,JanusFlow在多模态理解和生成任务上表现出色。