特斯拉擎天柱机器人最新进展:“零样本”魔性舞蹈秀翻全场,全靠模拟器苦练?

特斯拉展示了擎天柱机器人通过强化学习在模拟环境中训练并实现‘零样本迁移’的最新成果。这次演示展示了机器人能够在真实世界中成功执行复杂动作,省去了大量调试时间和成本。

17000字Claude 系统提示启示:Karpathy 揭秘LLM 学习缺失“第三范式”

Andrej Karpathy提出LLM学习中缺失的环节是’系统提示词学习’。他认为人类的学习更多是通过明确的语言记住解决问题的方法,而非零散的记忆。Karpathy还分析了Claude系统的惊人提示词内容及其潜在应用价值。

RL很重要,但远非All You Need!微软副总裁:AI不靠单个技术撑起

微软副总裁 Nando de Freitas 提出 AI 是一场系统性工程的观点,反对单一技术的过度宣传。他认为AI的进步需要成千上万人的共同努力,并强调了多元参与和技术探索的重要性。

Vision-R1:多模态领域的DeepSeek R1-Zero,7B参数比肩OpenAI O1

Vision-R1项目通过两阶段策略解决了多模态推理数据稀缺的问题,提出冷启动初始化和RL训练方案,并创新性地引入PTST策略和HFRRF奖励函数,显著提升了模型在多个数学推理基准测试中的表现。