PaperWeekly，作者每时AI

ICML 2025 北大KA-Prompt首创提示知识对齐范式，跨域推理不再“鸡同鸭讲”

2025年6月17日16时作者 PaperWeekly

中持续适应新领域（如风格变化、环境扰动），同时保留历史知识。传统 DIL 方法面临两难困境：一方面，

2025年6月17日16时作者 PaperWeekly

文章推荐了咕泡科技的一站式科研辅导服务，帮助解决科研过程中选题、实验设计及验证、创新点设计等问题。导师会从多个方面进行细致指导，并提供快速投稿支持和高资质专家的配套服务，适合多种科研需求人群。

2025年6月16日23时作者 PaperWeekly

到社交媒体，高质量且符合人类期望的视频生成模型正变得越来越重要。如何准确评估这些模型的性能，确保它们

2025年6月16日23时作者 PaperWeekly

方法 SCAR（Style Consistency-Aware Response Ranking），

2025年6月16日23时作者 PaperWeekly

基于“重复采样-投票”框架在测试时进行大量采样以提高回答的准确性，有时一个问题甚至需采样成百上千次，

2025年6月12日16时作者 PaperWeekly

VidText 提出了一套全面的视频文本理解基准，覆盖 27 个真实场景和多种语言。它包含从视觉感知到跨模态推理的多个任务，评估模型在不同粒度上的表现，并揭示了影响性能的关键因素。

2025年6月12日16时作者 PaperWeekly

发展，现代的视觉语言模型可以生成详细而全面的描述。然而，由于评测的主观性和困难，当前的视觉语言评测往

2025年6月12日16时作者 PaperWeekly

大语言模型驱动的多智能体系统在构建时面临手动设计和调试的瓶颈。新加坡国立大学等团队推出MaAS框架，利用智能体超网技术实现按需定制的动态智能体服务，提高效率并降低成本。

2025年6月11日16时作者 PaperWeekly

VRAG-RL 是一种基于强化学习的视觉检索增强生成方法，通过引入多模态智能体训练，实现了视觉语言模型在检索、推理和理解复杂视觉信息方面的显著提升。

2025年6月11日16时作者 PaperWeekly

研究构建首个面向MLLM的细粒度AES基准EssayJudge，采用10项细粒度评分维度，涵盖词汇、句子和文章三个层级，评价作文质量。