你的Agent电脑助手正在踩雷!最新研究揭秘Computer-Use Agent的安全漏洞
中国科学技术大学、上海交通大学和上海 AI Lab 联合推出 CUAs 安全测试基准 RiOSWorld,全面评估 Computer-Use Agent 在真实电脑使用场景中的安全风险。实验结果显示大多数 Agent 风险意图率高且完成率高,指出当前多数基于 MLLM 的 CUA 缺乏风险意识。该研究已开源论文、项目官网及 GitHub 代码。
中国科学技术大学、上海交通大学和上海 AI Lab 联合推出 CUAs 安全测试基准 RiOSWorld,全面评估 Computer-Use Agent 在真实电脑使用场景中的安全风险。实验结果显示大多数 Agent 风险意图率高且完成率高,指出当前多数基于 MLLM 的 CUA 缺乏风险意识。该研究已开源论文、项目官网及 GitHub 代码。
阶跃星辰发布开源图像编辑模型 Step1X-Edit,参数量为19B,在多种真实用户指令上达到SOTA水平,并实现了多模态语言理解与扩散图像生成的深度融合。
MLNLP社区是一国际知名的机器学习与自然语言处理社区,旨在促进领域内的交流合作。该综述系统性探讨了多模态大型模型持续学习的研究进展,涵盖模型架构与方法创新、评测基准介绍及未来发展趋势讨论。