阿里开源R1-Omni,DeepSeek同款RLVR首度结合全模态情感识别,网友:可解释性+多模态学习=下一代AI

阿里通义实验室薄列峰团队首次将RLVR应用于包含音频、动态视觉内容的全模态LLM,聚焦情感识别任务。研究发现模型在分布内和分布外数据集上均有显著提升,并能清晰分析不同模态的作用,目前这些模型已开源。

从零开始自主「起身站立」,上海AI Lab发布最新控制算法,机器人:起猛了

上海AI Lab研究团队提出HoST算法,让机器人成功实现多种复杂环境下的自主站起。通过强化学习和多项技术优化,在仿真及真实环境中均表现出色,为人形机器人的实际应用提供了创新解决方案。

全新模型RoboVLMs解锁VLA无限可能,真实机器人实验交出满分答卷

本文介绍了一篇关于视觉语言动作模型(VLAs)的论文,提出了RoboVLMs模型来解决机器人领域的多个任务。文章通过实验提出了一些设计准则,包括选择合适的基座模型和在预训练阶段引入跨本体数据等。