「空间推理」成大厂竞逐焦点,为什么让大模型理解「内外远近」更重要?
本周解读③个值得关注的AI及机器人领域要事,包括「空间推理」成为各大公司竞逐的关键技术方向;模型越强反而可能变得保守,以及LeCun关于AGI等议题的新见解。重点探讨了空间推理的重要性及其在多领域的潜在应用。
本周解读③个值得关注的AI及机器人领域要事,包括「空间推理」成为各大公司竞逐的关键技术方向;模型越强反而可能变得保守,以及LeCun关于AGI等议题的新见解。重点探讨了空间推理的重要性及其在多领域的潜在应用。
OpenAI 新模型 o3 在 ARC-AGI 基准测试中取得了显著进步,但仍有部分任务无法解决。o3 能够适应新任务的能力实现了质的飞跃,但仍存在一些局限性。
腾讯 AI Lab 研究发现低比特量化仅在未充分训练的 LLM 上能取得与 fp16/bf16 相当的性能表现,提出了一套低比特量化的 scaling laws,并通过实验验证其普适性。
本周最受关注的进展包括DeepSeek发布6710亿参数模型DeepSeek-V3、智谱开源GLM-PC基座模型CogAgent-9B、阶跃星辰推出增强型AI图像模型Step-1X-Medium、阿里通义千问开源视觉推理模型QVQ-72B-Preview、马斯克xAI完成60亿美元C轮融资以及Cursor融资1亿美元。这些进展涵盖了AI领域的算法优化、模型性能提升及投资动态,体现了技术进步和行业发展的前沿方向。
Google DeepMind的研究表明逆向思维训练大模型(LLMs)能显著提升其推理能力,通过构建包含正反向问题的数据集并利用知识蒸馏框架优化模型。
MLNLP社区介绍了一条从捷径到探索的路径——OpenAI的o1范式,通过大量数据标注提高模型应对复杂任务的能力,并在近期发布的新版本o3展示了其快速进步。
吴恩达宣布Aisuite目标是提供一个类似OpenAI的API来简化使用多个LLM的过程,只需更改一个字符串即可选择所需的LLM提供程序。该库支持多种LLM提供商,并要求开发人员拥有相应的API密钥。
雷军以千万级薪酬挖角AI天才罗福莉领军小米AI大模型团队。95后罗福莉曾在国际顶会发表8篇论文,学术背景出色。小米计划建设万卡级GPU集群并拥有丰富应用场景,有望成AI领域的黑马。