一个md文件收获超400 star,这份综述分四大范式全面解析了3D场景生成
该综述全面调研了3D场景生成领域,将现有方法划分为四大类,并揭示了不同方法在可控性、真实性、效率与一致性之间的权衡,提出了高质量数据瓶颈和评估缺乏统一标准等四大挑战及未来发展方向。
该综述全面调研了3D场景生成领域,将现有方法划分为四大类,并揭示了不同方法在可控性、真实性、效率与一致性之间的权衡,提出了高质量数据瓶颈和评估缺乏统一标准等四大挑战及未来发展方向。
A Survey on Trustworthy LLM Agents: Threats and Countermeasures, a study by researchers from Nanyang Technological University and Squirrel AI, categorizes Agent safety issues into internal (Brain, Memory, Tool) and external (User, Agent, Environment) modules. It provides insights for future research directions such as collaborative security mechanisms and adversarial robustness training methods.
TrustAgent Survey 是一项研究综述工作,系统性地概述了可信大型语言模型代理的安全模块化体系架构,聚焦于凝练 Agent 安全的研究进展,并提出未来研究方向和展望。
第五届对抗机器学习Workshop将在2025年6月的CVPR会议上举行,主题为’基础模型+X’。研讨会旨在探讨基础模型及其特定领域应用中的鲁棒性挑战,并设立最佳论文奖等奖项吸引投稿。
DiffSensei 是首个结合多模态大语言模型(MLLM)与扩散模型的定制化漫画生成框架,通过创新机制实现角色控制、布局精准及动态叙事。该框架支持从文本到漫画的高效转换,并发布首个专为漫画生成设计的数据集MangaZero,提升角色一致性、文本跟随能力和图像质量。
西湖大学等团队提出StyleStudio,通过跨模态AdaIN技术、教师模型稳定布局及基于风格的无分类器引导,有效解决文本驱动风格迁移中的对齐问题、布局不稳定和模糊性等问题,提升生成图像质量和稳定性。
近年来,群体机器人系统通过多个简单个体协同工作,在物流、医疗等领域应用广泛。南洋理工大学教授提出的新控制算法TGI显著提高了昆虫的安全性、续航能力和适应性,减少了纠缠现象的发生,并能帮助翻倒的昆虫重新站起来,增强了群体整体韧性。
薛复昭博士分享了他在学术生涯中的七点心得,包括工程能力的重要性、与优秀人才合作、专注于重要论文、研究趋势的演变、换位思考以及博士学位的价值。他指出,虽然攻读博士学位有助于科研技能的学习,但不是从事大语言模型研究的必要条件。
新智元报道
编辑:LRST
SOLAMI是南洋理工大学研发的首个VR端3D角色扮演AI系统,支持用户通过语音和肢体语言与虚拟角色互动。它利用先进的社交视觉-语言-行为模型,提供自然交流体验,超越传统交互方式。
MMRel是首个大规模、高质量的物体间关系理解数据集,用于评估和提升多模态大模型能力。包含超过22K问答对,覆盖三个领域与三种关系类型,通过半自动流程生成并提供高难度子集测试极限性能。