西湖大学归档

单卡4090也能高质量视频编辑！西湖AGI Lab无训练框架FlowDirector来了

2025年6月14日16时作者机器之心

西湖大学AGI实验室团队提出FlowDirector，无需训练的视频编辑框架，通过流匹配范式直接在数据域构造演化路径，实现高质量对象编辑、添加、删除和替换功能。

SOTA级视频编辑新方法：无需训练一句话编辑视频，背景保持100%

2025年6月10日16时作者量子位

传统的视频编辑方法存在多个问题，西湖大学AGILab提出FlowDirector新方法。无需反演和训练，实现高质量、准确的视频编辑，开销低且支持多种编辑任务。

无需SFT也不用RL，样本级推理优化神器SLOT来了，准确率轻松+10%

2025年6月9日23时作者机器之心

西湖大学研究团队提出SLOT方法，在推理时通过优化delta参数向量调整输出词汇概率分布，显著提升语言模型在复杂指令上的表现。

多模态模型挑战北京杭州地铁图！o3成绩显著，但跟人类有差距

2025年6月7日16时作者量子位

近年来多模态大模型在理解和复杂推理任务中取得进展，但其对高分辨率图像（如地铁图）的理解能力仍存争议。为此，西湖大学、新加坡国立大学等团队提出ReasonMap评测基准，聚焦于高分辨率交通图的多模态推理，发现当前开源模型存在性能瓶颈，并指出强化学习后训练模型在某些维度上优于现有模型。

挑战AI数学推理极限！大规模形式化数学基准FormalMATH发布，最强模型成功率仅16%

2025年5月7日23时作者量子位

香港中文大学等机构联合推出FormalMATH基准测试，包含5560道经过验证的数学题。尽管大语言模型在自然语言处理和代码生成领域表现优异，但在数学定理证明任务中成功率仅为16.46%。研究提出了一套三阶段过滤框架用于自动形式化和语义一致性检测，并分析了现有LLM证明器的表现，发现代数较强而微积分较弱，存在滥用自动化策略的问题。