蛋白质突变工程 AI 模型评测新基准,上海交大洪亮教授团队发布 VenusMutHub

上海交通大学洪亮教授团队发布VenusMutHub——首个针对真实应用场景的蛋白质突变小样本数据集及评测标准。该研究发表在Acta Pharmaceutica Sinica B期刊上,揭示了现有AI模型在实际应用中的局限性,并提出改进方案。

上交大等提出MM-Eureka:R1-Zero的「Aha Moment」同样存在于多模态推理

本文介绍了一种新的多模态大规模强化学习框架MM-Eureka,该框架能够稳定地训练包括InternVL2.5-Instruct-8B和InternVL2.5-Pretrained-38B在内的多种大型模型,并使用较少的数据实现了性能的提升。

CVPR 2025:长Prompt对齐问题也能评估了!当前最大AIGC评估数据集,模型评分超越当前SOTA

上海交通大学-美团计算与智能联合实验室的论文被CVPR录用,提出Q-Eval-100K数据集与Q-Eval-Score评估框架解决文本到视觉模型质量评估问题。该数据集包含大量高质量AIGC生成数据,并通过多种策略提高评估精度。

DeepSeek“防弹衣”来了,模型内生安全加固方案,拒绝杀敌一千自损八百|上海AI Lab

最新研究显示DeepSeek-R1模型存在安全隐患。上海交大与上海AI Lab联合提出X-Boundary防御方案,通过分离安全和有害表征并定向消除有害表征来实现精准高效的安全加固,避免了过度安全导致的模型性能下降的问题。

自动调整推理链长度,SCoT来了!为激发推理能力研究还提出了一个新架构

SCoT团队提出了一种新的推理范式SCoT,它能动态调整推理链长度来适应不同复杂度的问题。AtomThink框架则是一个全过程训练和评估的系统,旨在提升多模态大模型在复杂推理任务上的表现。

上交CVPR 满分论文数据蒸馏技术,直接把 GPU 显存 “砍掉” 300 倍

一项研究提出了一种新的数据集蒸馏方法NCFM (Neural Characteristic Function Matching),大幅提升了性能并实现了资源效率的飞跃。它通过引入神经特征函数差异度量指标,解决了现有方法的局限性,仅需2.3GB显存即可在单张GPU上完成CIFAR-100无损蒸馏,并显著超越了现有的SOTA方法。