PaperWeekly，作者每时AI - 第17页共39页

权威赛事！2025全球人工智能技术创新大赛硬件挑战赛重磅开启，50万奖金等你赢

2025-03-21 作者 PaperWeekly

阿里云推出新款高性能服务器，提升计算性能和存储能力。

打破自回归模型的“速度枷锁”！NYU、宾大等发布「推测解码技术」最新综述

2025-03-21 作者 PaperWeekly

制约其发展的关键瓶颈。
在这一背景下，如何在保持高质量输出的同时，显著提升模型的推理速度，以满足实时

AI Agent真的安全吗？南洋理工最新综述揭秘LLM Agent安全风险与防御策略

2025-03-20 作者 PaperWeekly

A Survey on Trustworthy LLM Agents: Threats and Countermeasures, a study by researchers from Nanyang Technological University and Squirrel AI, categorizes Agent safety issues into internal (Brain, Memory, Tool) and external (User, Agent, Environment) modules. It provides insights for future research directions such as collaborative security mechanisms and adversarial robustness training methods.

录用率仅22%！如何看待CVPR 2025的审稿结果?

2025-03-20 作者 PaperWeekly

CVPR 2025共收到13008份投稿，最终仅有2878篇被录用，录取率为22.1%。文章介绍了几个科研成功案例，并推荐了沃恩智慧的服务。

更精细的解耦评估！VisualSimpleQA开创视觉语言大模型事实问答评测新范式

2025-03-20 作者 PaperWeekly

VisualSimpleQA 提出了一个面向事实查询的多模态评测基准，旨在有效评估大型视觉语言模型（LVLMs）在事实问答任务中的表现。该基准采用了解耦评估框架和明确的样本难度标准，能够区分不同模型的表现，并揭示了当前前沿 LVLMs 在视觉和语言模块上的改进空间。

复旦、同济等联合提出基于深度强化学习的社区布局生成方法

2025-03-19 作者 PaperWeekly

（Reinforcement Learning, RL）在模型训练与推理优化中的价值越发凸显。通过对

ICLR 2025 小型AI也能懂人类？中山大学全新方法ADPA让小模型对齐实现大突破！

2025-03-19 作者 PaperWeekly

型偏好对齐
背景
在
AI
的世界里，大型语言模型（
LLMs
）凭借强大的参数量和计算能力，已经能

NeurIPS 2024 已开源！港科广团队提出Hawk：面向开放世界的视频异常理解框架

2025-03-19 作者 PaperWeekly

通事故等，从而减少人工干预、提高效率。在大模型时代，随着大规模预训练模型，尤其是视觉语言模型（VLM

长视频性能提升6.6%！用文本数据撬动视频理解

2025-03-18 作者 PaperWeekly

Sparrow 通过利用长文本 QA 数据合成“伪视频指令数据”，在仅使用30K混合数据的情况下超越了100K视频数据，且在数据规模扩展上性能优势更为明显。该研究重新审视了合成数据的特性，并提出了一种新的数据增强方法——Sparrow，显著提升了模型在长视频理解上的表现。

上交大等提出MM-Eureka：R1-Zero的「Aha Moment」同样存在于多模态推理

2025-03-18 作者 PaperWeekly

本文介绍了一种新的多模态大规模强化学习框架MM-Eureka，该框架能够稳定地训练包括InternVL2.5-Instruct-8B和InternVL2.5-Pretrained-38B在内的多种大型模型，并使用较少的数据实现了性能的提升。