清华大学归档 - 第10页共14页

清华、东大等发布EMAGE，音频自动生成动作丰富的视频

上午8时 2025/02/07 作者 AIGC开放社区

专注于AIGC领域，介绍了东京大学等联合开发的创新模型EMAGE及其数据集BEAT2。EMAGE能根据音频自动生成连贯动作和表情，与同类模型相比表现更优，并详细描述了其技术机制和应用优势。

下午12时 2025/01/29 作者量子位

清华大学THUNLP团队联合东北大学NEUIR、面壁智能及9#AISoft团队推出的UltraRAG框架革新了RAG系统的开发与配置方式，提供一键式便捷操作和模块化设计，显著降低学习成本和开发周期。

下午2时 2025/01/25 作者 Hugging Face

上海AI实验室联合团队推出Mini-InternVL多模态大模型，仅5%参数量实现90%性能，支持自动驾驶、医学图片感知等垂类任务。

下午11时 2025/01/23 作者 NLP工程化

Quant-Wiki 是一个开源的量化金融知识百科，致力于打破信息差，帮助更多人学习量化投资的核心知识和实战策略。

下午4时 2025/01/23 作者 AI寒武纪

字节联合清华发布的UI-TARS AI Agent纯视觉感知、端到端架构及系统2推理能力使其成为通用GUI自动化新突破。多项硬核数据验证其性能超越Claude和GPT-4等现有模型。

下午4时 2025/01/22 作者新智元

新智元报道
编辑：LRST
【新智元导读】
Eko是一个强大的Agent开发框架，开发者能用自然语言

下午4时 2025/01/17 作者机器之心

Uni-AdaFocus 是一个通用的高效视频理解框架，通过降低时间、空间和样本冗余性实现了统一建模，并已在多个数据集上验证了其有效性。