RL「误人」?LeCun 在技术路线上又有何战略摇摆?
Karpathy 认为强化学习早期决策是一个错误,并认为 LeCun 对强化学习的态度一直正确。LeCun 历年推崇的关键技术有无监督学习、自监督学习、Energy-Based SSL 和 Objective-Driven AI,他认为强化学习存在局限性,不适合作为实现人类水平智能的主要方法。
Karpathy 认为强化学习早期决策是一个错误,并认为 LeCun 对强化学习的态度一直正确。LeCun 历年推崇的关键技术有无监督学习、自监督学习、Energy-Based SSL 和 Objective-Driven AI,他认为强化学习存在局限性,不适合作为实现人类水平智能的主要方法。
牛津大学提出Kinetix框架,训练通用RL智能体在2D物理环境中执行多样化任务,涵盖机器人任务、经典RL环境等。通过Jax2D硬件加速引擎模拟数十亿次交互生成多样任务。研究发现微调使通用智能体能显著减少特定任务学习所需样本数,并带来新能力。
开源 AI 视频社区新成员 Lightricks 推出首个能实时生成高质量视频的 DiT 模型,其速度比普通视频观看快。该模型名为 LTX-Video,在一块 Nvidia H100 上仅需 4 秒即可生成 5 秒时长的 24FPS 视频,代码库和模型权重已开源。
AI 监工系统在职场引发热议,包括键盘记录、鼠标移动追踪等常见功能,还有生产力图表、无意义活动警告等创新监控方式。网友批评这些措施侵犯隐私,造成压力,并认为这会降低员工创造力与自主感。
北大团队开发的ChatExcel最新升级版,一句话就能搞定线性分析、图表绘制及文字总结。它能处理多表格数据,并支持400个Excel函数进行复杂数据分析与报告生成。
Meta团队提出SAMURAI模型,使用经典卡尔曼滤波器解决了SAM 2在快速移动物体场景下的跟踪问题。它在视觉目标跟踪任务上取得了显著改进,无需重新训练即可运行,并且已在多个基准数据集上超过了原始SAM 2的表现。