跳至内容
近日,跨维智能重磅发布人形机器人DexFoece W1,关于这款新产品,机器人大讲堂独家采访到了跨维智能CTO金毅博士,拿到了更多的技术细节。
此前,跨维智能作为一家具身智能大脑和传感器为核心的企业,开发出了全球范围内为数不多的已经完成商业落地闭环的DexVerse™ 具身智能引擎。本次推出W1新品,不但能进一步验证与探索跨维DexVerse™ 引擎助力人形机器人与具身智能的强大能力,更表明了跨维正在积极探索与拓展具身智能商业化落地的更多可能。
从外观来看,该机器人整体采用黄与黑的融合配色,构型为轮足底盘与人形上半身,执行机构有双臂以及灵巧手,整体集成度较高,轮廓曲线流畅优美,W1展开站立后与人高度类似,具备更多场景的适应性和亲和力,头部还能进行上下左右转动,便于全方位感知环境及对象情况。
设计一款人形机器人到底难不难?对跨维智能而言,或许已经掌握了从研发到落地的正确方法论。因为W1这款人形新品,在跨维内部从0到1,从设计研发到实际成型部署,仅花费了极短时间。而且金博士透露,W1全身34个动力单元由一套高实时的控制系统协调控制,这就使得W1能够在移动的同时快速完成双臂、双手及其他关节的控制,增加了作业效率和灵活性。
W1颈部有两个自由度,头部采用6厘米基线距离的双目仿人传感器,能实现人类作业场景下多任务作业的感知闭环。W1搭载7自由度柔性机械臂和6自由度力控灵巧手,单臂最大负载达10KG,续航时间8小时并能实现1小时快速充电,底层运动控制频率达1000次/秒,通信带宽100Mbps,能满足大部分科研、工业制造、物流等场景需求。
快速开发出一款作业能力强悍的人形机器人,这本质上得益于跨维团队在机器人大小脑以及感知等核心技术的积累。例如在W1的设计阶段,跨维智能依托DexVerse™ 引擎,在仿真阶段就从各个角度完善产品设计,从W1的视角去感知环境,以W1的双臂、双手去与周边交互,不仅确保了机器人的作业空间可达性、减少了动作干涉,更通过这个交互的过程反复优化了本体的结构设计。这个反复优化本体结构设计的过程结合了跨维的AI技术,有别于传统设计过程完全依赖机械设计工程师的经验的方式,跨维创新性的采用了在参数空间中进行离散加局部连续优化的方法,使得W1的构型对各种作业场景及任务的适应能力更强,同时保留了设计师的原创概念。
W1双目纯视觉传感器的设计模拟了人类的双眼,能够克服传统视觉传感器对强光、透明、高反射等物体识别、定位能力弱的特点,能够更好地实现复杂环境下的感知。使W1具备类人级别的空间感知能力,最终将这种感知能力映射到实际的人类生产、生活的环境和日常任务中。
除此之外,再配合颈部2个自由度,W1能实现相对更大的水平和垂直视野,在部分作业任务需求时,W1还可以通过转动颈部来获得更优质的视觉图像支持。这种方式相较转动腰部等身体其他关节无疑更为高效。
金博士表示,轮式底盘的机器人更适合在相对结构化的场景下落地。一方面,从场景特性来看,在绝大多数智能制造、酒店、商超等场景下,地面绝大部分还是平地,并不需要机器人爬楼梯或者进入复杂地形。另一方面从构型来看,双足人形机器人双腿需要搭载12个电机,但W1这种轮式底盘却相当于减少了8个电机,无论是从整体构型的复杂度、成本,还是能源使用效率上,轮式底盘都是更优解。而且可以发现,W1这种轮式底盘能将搭载锂电池的部位下移,20公斤重的电池放在底盘上,就能让机器人作业时重心整体下沉,提高了作业稳定性与安全性,同时增加了续航。在阐述了为什么跨维的第一款人形机器人选择了轮式底盘之后,金博士表示,跨维也在积极的布局双足人形机器人,并且它们会共享同一套具身智能软硬件平台。
可以说跨维智能在W1上已经验证,基于Sim2Real具身智能引擎,开发者能够更高效地探索广泛的设计空间,在最大化强度的同时最小化材料的使用以进行各种结构上的创新,让本体及末端执行器构型等在机器人任务执行成功率、执行效率、硬件成本等方面不断趋于最优解。
更值得一提的是,在软件与系统架构层面,W1人形机器人也是业内首款基于Sim2Real具身智能引擎定义的新产品,其采用的DexVerse™ 引擎,能够实现海量数据生成+高效仿真实现场景的快速模型训练及部署。
人形机器人并不能只是空壳,还需要有完成任务的“打工魂”。从具体任务落地来看,W1能够通过空间智能传感器,智能的识别目标对象,看清装载了物体的料箱,并分解任务步骤,柔顺地自主完成抓取、搬运等任务,同时,W1还可以完成组装、打螺丝等柔性化任务,从而满足大多数工业场景的任务需求。
W1等人形机器人产品实现该能力并非易事,基础模型的训练决定了人形机器人对复杂环境的感知与理解的速度,决定了机器人的对复杂任务的自主执行能力,进而影响甚至决定机器人进入陌生场景的部署周期长短和局部任务的执行效率。
跨维在机器人训练数据上有着领先优势,从而能够在现实任务过程中表现优异。据金博士透露,在W1的基础模型训练阶段,跨维首先采用大量的网络数据以及视频合成数据,通过DexVerse™ 引擎仿真出海量且全面的场景及作业数据集,合成数据并自动生成精准标注,并在这些海量数据的基础上训练W1的基础模型。这个过程大大减少了数据采集的时间和人力成本。
由于经过了数据本身的Real2Sim过程和Sim的扩增过程,跨维可以轻易地完成数据多样性的增加(例如变更仿真物体的资产,从而实现类别级泛化;变更场景,从而增加面向不同环境的鲁棒性;变更物体的姿态,从而实现空间泛化),来保障在模型训练阶段是获得了充分的变量学习的。这使得W1的基础模型在经过训练后具备相当的泛化性,提升了其在不同作业环境及作业任务中的鲁棒性。
在机器人产品的实际落地中,尤其在部分连续长任务或者离散抓取任务中,由于仿真器的碰撞几何学中大多存在简化假设,动作通过执行器和传动装置传递的方式可能并不准确,从仿真模拟器中训练的策略迁移到机器人上,可能存在实际运行效率低下和准确性差的情况。W1搭载的跨维自研视觉-动作模型形成误差调整的闭环,双目作为可高频获取隐式3D信息的传感器是这条闭环的重要保障。在装配任务中,我们看到W1能够眼手配合,操作工具完成毫米级高精准的螺丝装配任务。
金博士对机器人大讲堂透露,跨维正在W1的基础上,持续完善大脑+小脑+感知的各种基础技术,积极开展软硬件和算法的纵向研发。与此同时,跨维也基于其视觉灵巧操作的研发积累,开展产学研合作,寻求W1在科研与工业等领域的落地以及商业化的探索,逐步扩充W1的基础技能以及提升落地成功率,最终由点带面让W1落地更多商业场景。
“这波机器人浪潮与以往数十年最大的不同在于机器人开始有了大脑加持,以及得益于行业过往硬件技术的持续突破,我们开始认识到有了大脑的人形机器人原来真的可以进入千家万户。这个改变使得当前的时代,值得热衷于研发的我们全力以赴。”金博士说道。
基于DexVerse™ 引擎的整套方案,跨维早已具备“三维数字资产生成-数据合成与标注-物理仿真-模型训练-模型部署”全链条自动化能力,掌握了空间智能与具身智能的核心底座。
“因此对于跨维而言,推出人形机器人,其实只不过是把在单个机械臂或者工作站落地的技术,换到了人形机器人这个更好的载体。”金博士总结到。
(文:机器人大讲堂)