告别O(n²)!上海AI Lab开源Linear-MoE:线性注意力+MoE的终极缝合术
近期研究表明,线性序列建模(如 Lightning Attention、Mamba2)与混合专家模型架构(MoE)的结合在高效大模型领域引起了广泛关注。上海人工智能实验室团队的最新研究首次系统地实现了这两种技术的结合,并开源了完整的技术框架。
近期研究表明,线性序列建模(如 Lightning Attention、Mamba2)与混合专家模型架构(MoE)的结合在高效大模型领域引起了广泛关注。上海人工智能实验室团队的最新研究首次系统地实现了这两种技术的结合,并开源了完整的技术框架。
北京大学等机构提出GAPrompt,一种面向三维视觉预训练模型的几何感知高效微调方法,通过引入点云结构化提示提升下游任务中的几何适应能力。该研究已被人工智能顶会ICML 2025接收,并已开源相关代码与模型。
本末科技完成B轮及B+轮融资,累计金额数亿元。融资资金将用于提升直驱关节模组规模化交付能力、加速机器人产品开发迭代与商业化落地。公司已推出多款轮足式机器人并构建了从零部件到整机的技术体系,成为全球轮足机器人出货量最高企业之一。
美国载人航天面临困境,特朗普可能取消马斯克的政府合同,导致龙飞船项目停运,引发轩然大波。NASA将失去唯一本土载人航天器,迫使选择依赖俄罗斯联盟号及波音太空舱。
宇树科技CEO王兴兴在2025北京智源大会上表示,通过表演和赛事等形式展示人形机器人技术发展现状,并开展商业化拓展。他预测机器人格斗未来可能成为全球性体育赛事。
Qwen3 Embedding系列发布,支持多语言文本表征、检索与排序任务。8B版本性能卓越,在MTEB多语言Leaderboard榜单中排名第一。支持0.6B/4B/8B三种尺寸,已在Hugging Face等平台开源。主要亮点包括泛化性强、架构灵活及自定义特性等。
谷歌通过多个账号宣布Gemini 2.5 Pro新版本发布,该版本在多项任务中表现出色,并且在“人类最后的考试”数据集中的表现超越了竞争对手O3。新版Gemini还提升了Elo评分,并且在价格方面也更具优势。