文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了

上海科技大学硕士生徐京伟和忆生科技王晨宇等人提出的CAD-MLLM模型,支持文本、图像和点云输入生成高质量的CAD模型。该模型填补了CAD多模态数据资源的空白,并提出了四种评估CAD拓扑质量和空间封闭性的指标。

RL「误人」?LeCun 在技术路线上又有何战略摇摆?

Karpathy 认为强化学习早期决策是一个错误,并认为 LeCun 对强化学习的态度一直正确。LeCun 历年推崇的关键技术有无监督学习、自监督学习、Energy-Based SSL 和 Objective-Driven AI,他认为强化学习存在局限性,不适合作为实现人类水平智能的主要方法。

智能体零样本解决未见过人类设计环境!全靠这个开放式物理RL环境空间

牛津大学提出Kinetix框架,训练通用RL智能体在2D物理环境中执行多样化任务,涵盖机器人任务、经典RL环境等。通过Jax2D硬件加速引擎模拟数十亿次交互生成多样任务。研究发现微调使通用智能体能显著减少特定任务学习所需样本数,并带来新能力。