2025年3月25日16时 - 第6页共12页

世界首个！性能超扩散模型256%，推理快21.8倍，Uni-3DAR用自回归统一微观与宏观的3D世界

2025年3月25日16时作者 PaperWeekly

e、具身智能三大 AI 热门领域共同关注的焦点。而随着 AI 技术的发展，大型语言模型（LLM）与大

推理延展到真实物理世界，英伟达Cosmos-Reason1：8B具身推理表现超过OpenAI ο1

2025年3月25日16时作者机器之心

答案的情况，比如以下例子：
根据视频中本车的动作，它接下来最有可能立即采取的行动是什么？
A：右转，

全球顶级模型集体0分，AI终极大考人类5分钟秒杀！Keras之父戳破AGI神话

2025年3月25日16时作者新智元

类用5分钟轻松解开的谜题，却让最顶尖LLM全线崩盘得分挂零，o3更是从曾经76%暴跌至4%。它正式宣

大模型在简单物理现象理解任务上的认知困境：联想能力将是AGI之路上的下一个关键？

2025年3月25日16时作者 PaperWeekly

率攻克 ARC-AGI 挑战、DeepSeek 在数学推理中展现惊人效率时，一个根本问题始终悬而未决

挖掘DiT的位置解耦特性，Personalize Anything免训练实现个性化图像生成

2025年3月25日16时作者机器之心

本文介绍了一种全新的架构设计 Personalize Anything，它能够在无需训练的情况下完成概念主体的高度细节还原，并支持位置控制和多种应用。通过创新的标记替换机制和特征扰动技术，团队展示了其在保真度、可控性和多功能性上的优势，并将其应用于布局引导生成、多物体组合等场景。

埃默里大学、UT Austin联合提出Spatial-RAG：开启空间智能问答的新时代

2025年3月25日16时作者 PaperWeekly

然而，当涉及到
空间推理
任务时，LLMs 的表现却显得力不从心。空间推理不仅要求模型理解复杂的空间

阿里深夜开源Qwen2.5-VL新版本，视觉推理通杀，32B比72B更聪明

2025年3月25日16时作者机器之心

阿里通义千问团队发布新模型Qwen2.5-VL-32B，相比前代模型提升回复符合人类偏好、数学推理能力及图像细粒度理解与推理。

也看基于版式分析的PDF文档翻译项目及文档版式分析模型PP-DocLayout

2025年3月25日14时作者老刘说NLP

今天是2025年3月25日，星期二。文章介绍了两个文档相关的项目，一个是基于版式分析的PDF文档翻译项目Fast_pdf_trans和PDFMathTranslate，另一个是文档版式分析模型PP-DocLayout。PP-DocLayout能够检测多种类型的文档，并且其三种不同比例的模型在处理复杂布局方面表现良好。而PDFMathTranslate则使用Pdfminer.six等库解析PDF文档，保留了排版信息进行翻译。

RAG＆KG＆LLM＆文档智能技术前沿：老刘说NLP技术社区持续对外纳新

2025年3月25日14时作者老刘说NLP

老刘说NLP技术社区致力于通过早报、在线交流报告和专题分享等方式，围绕大模型、RAG、文档智能和知识图谱等主题，推动技术创新与交流。

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31