上海交通大学归档 - 每时AI

你的Agent电脑助手正在踩雷！最新研究揭秘Computer-Use Agent的安全漏洞

2025年7月8日23时作者极市干货

中国科学技术大学、上海交通大学和上海 AI Lab 联合推出 CUAs 安全测试基准 RiOSWorld，全面评估 Computer-Use Agent 在真实电脑使用场景中的安全风险。实验结果显示大多数 Agent 风险意图率高且完成率高，指出当前多数基于 MLLM 的 CUA 缺乏风险意识。该研究已开源论文、项目官网及 GitHub 代码。

用AI设计新材料，可实现“0能耗降温”

2025年7月5日11时作者财联社AI daily

上海交通大学科研团队在AI设计热辐射超材料方面取得突破，研发的逆向设计AI模型能在短时间内生成大量候选设计方案，并从中选出最优方案。该技术有望应用于建筑节能和极端环境温控等领域。

ICML 2025 多智能体的ChatGPT时刻？上交MAS-GPT实现工作流一键生成

2025年7月5日11时作者机器之心

上海交通大学联合团队提出MAS-GPT，通过生成式设计范式简化多智能体系统构建，只需一句Query就能生成一套可执行的MAS。MAS-GPT已在多个基准任务上超越现有方法，展示了高效和泛化能力。

CVPR2025 Dinomaly: 极简主义，让多类异常检测性能首次超越单类模型

2025年6月27日23时作者极市干货

清华大学等机构提出Dinomaly多类异常检测模型，通过极简主义的设计首次让多类异常检测性能逼近甚至超越单类模型，具有简单、高效、易于扩展的特点。

即将实施！节卡机器人主导制定新国家标准

2025年6月26日23时作者机器人大讲堂

国家标准《机器人智能化视觉评价方法及等级划分》正式发布，填补行业空白，推动中国机器人产业从功能实现向智能分级跃迁。节卡机器人主导制定此标准，涵盖工业、服务和特种机器人，定义5大类19项测试指标，并创新性地制定了3类视觉智能等级。

7B智能体仅凭9个任务训练即超越R1！上交大打造AI-for-AI新范式

2025年6月21日16时作者机器之心

研究提出了一种新的训练框架，让大模型自主设计和优化AI算法，显著减少人类干预。通过经验学习范式，7B参数的大模型ML-Agent在9个任务上持续探索学习，最终超越了671B规模的智能体。

单应计算加速数十倍、计算量减少95%！基于几何的SKS和ACA矩阵分解被提出

2025年6月19日16时作者机器之心

本文提出了一种基于几何变换的快速且可解释的2D单应矩阵分解方法（Similarity-Kernel-Similarity, SKS和Affine-Core-Affine, ACA）。该方法大幅减少了4点求解单应的时间，尤其适用于二维码扫描等应用。

工业异常检测新突破，复旦等多模态融合监测入选CVPR 2025

2025年6月16日16时作者量子位

复旦大学、荣旗工业科技、腾讯优图实验室等机构联合发布了高精度多模态数据集Real-IAD D³，并提出了一种基于此数据集的创新多模态融合检测方法，提升了工业异常检测性能。

知识类型视角切入，全面评测图像编辑模型推理能力：所有模型在「程序性推理」方面表现不佳

2025年6月13日16时作者量子位

东南大学联合多所研究机构提出了KRIS-Bench，一个评估图像编辑模型知识结构的基准。该基准从事实性、概念性和程序性知识三个层面测试编辑能力，并包含1267对图像指令样本，覆盖初级到高级任务难度。

统一20+多智能体方法，MASLab震撼发布

2025年6月13日16时作者机器之心

MASLab 提供了一个统一、全面的多智能体系统代码库，涵盖多种方法和评测基准。它支持跨领域实验，并提出MASLab-ReAct方法，用于评估大模型在多任务环境下的性能。