机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA
ByteDance Research团队提出WMP(World Model-based Perception),通过模拟训练世界模型和策略,实现在多种复杂地形上的出色控制表现。
ByteDance Research团队提出WMP(World Model-based Perception),通过模拟训练世界模型和策略,实现在多种复杂地形上的出色控制表现。
上海交通大学等联合研发的Light-A-Video技术无需训练即可实现零样本视频重打光,解决了视频编辑中的关键技术难题。该方法利用预训练模型和创新模块确保光照一致性和稳定性。
利用300多万个实例将代码转换成思考过程构建数据集CODEI/O,提升Qwen、Llama等模型推理能力,覆盖常识、数学、代码、物理、工程等多个领域。
AIxiv专栏介绍及其新成果HugWBC控制器,支持机器人同时掌握多种步态及精细调整行为指令,提高运动控制能力。该研究成果在模拟环境中训练,并通过评估验证其有效性。
上海交通大学提出SiTo方法,通过基于相似性的令牌剪枝技术,无需训练且硬件友好地加速扩散模型。显著提升了生成质量并减少了内存和计算成本。
集智俱乐部联合上海交通大学等组织发起「具身智能」读书会,采用自下而上的层级结构探讨机器人与具身智能技术前沿。读书会涵盖硬件系统设计、数据及仿真环境应用、机器人学习方法以及具体应用场景分析等内容,旨在促进跨学科合作,解决复杂性挑战、学习泛化等问题。
近期研究提出自回归移动扩散(ARMD)模型,该模型重新定义了时间序列的扩散过程,通过滑动操作和历史序列迭代生成未来序列预测。相较于传统基于噪声的方法,ARMD更好地模拟了时间序列的连续性演化特性,展示了在多个数据集上的优越性能。
上海交通大学和东方理工的研究团队提出了一种新的自回归移动扩散模型(ARMD),旨在解决当前基于扩散的时间序列预测方法在时间连续性上的不足。ARMD 模型利用历史数据预测未来,通过滑动操作生成中间状态,与传统方法不同的是,它实现了采样和预测目标的统一,提升了时间序列预测的效果。