AI能看懂图像却算不好距离,上交时间-空间智能基准难倒9大顶尖多模态模型

上海交通大学联合团队发布STI-Bench,评估多模态大模型的空间-时间理解能力。结果显示当前最强模型在自动驾驶和机器人操作任务中表现不佳,准确率低于50%。论文、代码及数据已开源,为改善MLLM空间智能提供了新基准。

中国大模型站上世界前列,其中阿里AI全球第三

近日,斯坦福大学以人为本人工智能研究所发布《2025年人工智能指数报告》,中国在顶尖AI模型数量和质量上保持领先,并在全球重要模型公司中占据第三。阿里AI贡献全球第三,靠的是技术实力而非PPT、PR或邀请码等软实力。

具身智能技术企业「穹彻智能」完成数亿元Pre-A++轮融资

穹彻智能近日完成数亿元Pre-A++轮融资,聚焦具身智能技术应用和商业化探索。联合创始人卢策吾及王世全主导研发的穹彻具身大脑Noematrix Brain具备多任务处理能力,并推出数据采集系统CoMiner。

斯坦福等开源代码定位AI Agent,极大提升开发、维护效率

斯坦福大学等研究团队开源了智能体LocAgent,用于解决复杂代码库中的代码定位问题。LocAgent通过图基表示技术捕捉代码结构和依赖关系,并利用稀疏层次实体索引快速搜索与问题描述相关的代码片段。

斯坦福团队开源!OpenVLA:小白也能搞机器人,100条数据就能微调!

近期开源的OpenVLA模型通过高效的参数利用和卓越性能推动了机器人技术的发展。基于Llama 2语言模型和融合视觉编码器,它能够将自然语言指令转化为精确的机器人动作。支持在消费级GPU上进行微调,并实现高效服务。应用场景包括家庭服务机器人、工业机器人及教育研究等领域。