斯坦福大学
68页论文再锤大模型竞技场!Llama4发布前私下测试27个版本,只取最佳成绩
大模型竞技场存在系统问题,包括厂商私下测试多个模型版本、数据访问不平等和排名变化快速。研究团队指出,这可能导致排行榜结果失真,并建议改进策略以提高其可信度。
围观!斯坦福最火AI课全球免费开讲,顶级大佬亲授Transformer精髓,课表全放送
斯坦福推出免费在线课程CS25: Transformers United V5,涵盖Transformer架构及其应用,包括语言模型、强化学习、AGI等前沿话题。
LocAgent:斯坦福联合耶鲁大学等机构推出的代码问题定位智能体
LocAgent 是一种基于图表示和大型语言模型(LLM)的代码问题定位框架,能够高效搜索和定位代码库中的相关代码实体,显著提升开发效率。
AI能看懂图像却算不好距离,上交时间-空间智能基准难倒9大顶尖多模态模型
上海交通大学联合团队发布STI-Bench,评估多模态大模型的空间-时间理解能力。结果显示当前最强模型在自动驾驶和机器人操作任务中表现不佳,准确率低于50%。论文、代码及数据已开源,为改善MLLM空间智能提供了新基准。
IC-Light的视频版本来了,RelightVid:强光动态环境下的视频光照编辑神器
复旦大学等机构学者发布视频版本光照编辑成果,支持时序一致性、强光源场景下的高质量光影编辑,构建全新数据集用于评估。
中国大模型站上世界前列,其中阿里AI全球第三
近日,斯坦福大学以人为本人工智能研究所发布《2025年人工智能指数报告》,中国在顶尖AI模型数量和质量上保持领先,并在全球重要模型公司中占据第三。阿里AI贡献全球第三,靠的是技术实力而非PPT、PR或邀请码等软实力。
具身智能技术企业「穹彻智能」完成数亿元Pre-A++轮融资
穹彻智能近日完成数亿元Pre-A++轮融资,聚焦具身智能技术应用和商业化探索。联合创始人卢策吾及王世全主导研发的穹彻具身大脑Noematrix Brain具备多任务处理能力,并推出数据采集系统CoMiner。