2025-05-27 - 第6页共11页

阿里开源长文本深度思考模型！渐进式强化学习破解长文本训练难题，登HuggingFace热榜

下午4时 2025/05/27 作者量子位

阿里开源的QwenLong-L1模型在HuggingFace今日热门论文第二，其32B参数版本性能优秀。对比基础模型，QwenLong-L1通过回溯和验证机制成功处理了长文本推理中的干扰信息问题，准确计算了金融文档中涉及优先票据发行成本与第一年利息支出合并的总资本成本。

下午4时 2025/05/27 作者机器之心

北京大学宋国杰教授团队综述论文首次系统梳理大语言模型心理测量学，提出三大革新方向，涵盖评估原则变革、新范式设计与应用项目反应理论。

下午4时 2025/05/27 作者机器之心

上海交大等团队推出Visual-ARFT项目，专为视觉语言模型设计多模态智能体训练方法，实现图像理解与操作能力。项目开源并测试表明其在复杂任务中超越GPT-4o，展现强大工具调用和推理能力。

下午4时 2025/05/27 作者新智元

华为诺亚提出的Pangu Light框架，一举打破了「剪枝即降智」魔咒，揭示出LLM瘦身的新路径。毫

下午4时 2025/05/27 作者 PaperWeekly

现。但过度依赖思维链（CoT）推理会降低模型性能，产生冗长输出，影响效率。
研究发现，长 CoT 推

下午4时 2025/05/27 作者机器之心

理能力。然而，RL 在推理任务之外的应用，尤其是在目标检测和目标定位等感知密集型任务中的应用，仍有

下午4时 2025/05/27 作者 PaperWeekly

信赖，可能远远不够。
你是否知道：
评估一个大模型完整跑完一套标准测试（如 HELM），可能耗时超过

下午4时 2025/05/27 作者机器之心

本文提出了一种新的端到端视觉 tokenizer 调优方法 ETT，解决了传统方法存在的问题，显著提升了多模态任务的性能。

下午4时 2025/05/27 作者 PaperWeekly

项研究成果：Liger（狮虎兽），即
Li
nearizing LLMs to
g
at
e
d
r

下午4时 2025/05/27 作者机器之心

CVPR 2025 论文分享会将在北京举办，主题包括多模态和视频生成。邀请顶级专家、论文作者参加Keynote演讲和圆桌对话，同时发布部分论文的摘要。