青年科学家归档

提升大模型内在透明度：无需外部模块实现高效监控与自发安全增强｜上海AI Lab & 上交

2025年6月23日16时作者量子位

上海人工智能实验室和上海交通大学的研究团队提出TELLME方法，通过表征解耦技术提升大模型内部透明度，实现可靠且简单的监控。该方法显著提升了模型的安全性和通用能力，并具有良好的扩展性。

MLNLP社区是国内外知名的机器学习与自然语言处理社区，旨在促进学术界、产业界和爱好者之间的交流与进步。院士卢耀如建议社会应多营造创新环境，鼓励青年科学家的成长。