ICLR 2025 机器人安灯泡、切东西都能拿捏,可操控轨迹跟踪的DexTrack来了
论文介绍了通用灵巧操控的研究,通过统一的轨迹跟踪任务表示和结合RL与IL的方法训练通用轨迹跟踪器,实现在多种复杂任务上的表现。
论文介绍了通用灵巧操控的研究,通过统一的轨迹跟踪任务表示和结合RL与IL的方法训练通用轨迹跟踪器,实现在多种复杂任务上的表现。
基于 Apple 的 MLX 框架构建的文本转语音 (TTS) 和语音转语音 (STS) 库,在 Apple Silicon 上提供高效支持,涵盖多语言、自定义选项和量化技术。
高效、可扩展的强化学习训练框架Search-R1,支持3B规模的基础LLM,通过规则化奖励机制让LLM自主学会推理和搜索,提供完整的训练流程和工具支持。