清华大学归档 - 第11页共14页

阶跃公开了自家新型注意力机制：KV缓存消耗直降93.7%，性能不减反增

下午4时 2025/01/17 作者机器之心

研究提出多矩阵分解注意力（MFA）及其变体 MFA-Key-Reuse，大幅降低语言模型推理成本的同时实现性能提升。

独家：清华系AI Infra明星企业“清程极智”完成新一轮融资｜

下午12时 2025/01/17 作者甲子光年

清程极智获新一轮融资，由北京市人工智能产业投资基金、中科创星及考拉基金等投资。该公司专注于智能算力系统软件开发，致力于解决国产芯片使用不便和效率低等问题，并推出自研的高性能推理引擎。

美国首个AI 禁令发布后，中国大模型六小龙之一的智谱 AI 被列入了实体清单

上午8时 2025/01/16 作者 APPSO

美国对中国的AI限制从芯片扩展至其他领域，导致国产大模型智谱被列入实体清单。对此，智谱回应称缺乏事实依据，并表示将持续为用户提供世界一流的大模型技术、产品和服务。

打脸！GPT-4o输出长度8k都勉强，陈丹琦团队新基准测试：所有模型输出都低于标称长度

下午11时 2025/01/15 作者量子位

最新研究提出LONGPROC基准测试评估长上下文语言模型处理复杂信息并生成回复的能力。尽管主流模型声称能处理32K tokens，但在实际应用中的表现并不尽如人意，尤其是对于复杂的多任务生成任务。

抢先OpenAI“虚拟员工”！清华复旦斯坦福联手，让Agent接管电脑帮你工作

下午4时 2025/01/14 作者量子位

清华、复旦等联合提出Eko框架，开发者通过简洁代码和自然语言快速构建虚拟员工，支持浏览器和电脑操作，具备生产级干预机制，实现自动化任务如数据收集、测试和文件管理。

史上最快，英伟达Sana模型安装和使用

下午11时 2025/01/12 作者路过银河AI

英伟达联合清华大学和麻省理工开发的Sana AI绘画大模型，在4090显卡上可实现不到一秒出高清图的效果。它在中国开发者中表现出色，有望降低大规模应用的成本。文章介绍了如何安装和使用该模型，并附有工作流下载链接。

英伟达联合清华、MIT推出史上最快绘画大模型

下午4时 2025/01/11 作者路过银河AI

英伟达联合清华大学、麻省理工大学推出Sana绘画模型，相比传统扩散模型在模型大小和推理速度方面有显著提升。其优势在于深度压缩自动编码器和高效的线性DiT模块。

微软联合清北推出rStar-Math技术，数学推理能力赶超OpenAI o1

下午4时 2025/01/11 作者多知

微软发布rStar-Math技术，让小型语言模型具备深度思考能力。通过蒙特卡罗树搜索方法，该技术在多个开源模型测试中取得了显著提升，甚至超越了OpenAI的o1-preview系统。

清华北大2025年起试点互相开放研究生课程

下午4时 2025/01/09 作者多知

清华大学与北京大学计划于2025年春季学期互相开放部分研究生课程，丰富学生选择并促进学术交流。

专注AIGC领域的专业社区分享了PRIME（Process Reinforcement through IMplicit REwards）算法在训练数学能力强大的7B模型方面的进展，该方法仅用8张A100、花费一万左右的成本，在不到10天内高效训练出了一个超过GPT-4和Llama-3.1-70B的7B模型Eurus-2-7B-PRIME，实现美国IMO选拔考试AIME 2024中准确率提升至26.7%。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30