央视网消息近日,北京通用人工智能研究院(以下简称“通研院”)正式发布人形机器人通用运动框架OmniXtreme(通极)。该框架成功让机器人学会执行包括后空翻、托马斯全旋、武术踢击在内的数十种高动态“极限运动”,并在机器人上实现了真实世界的高成功率部署,成为首个可以执行各种极限动作的通用策略。“一套算法统一多套运动”,为人形机器人学习复杂运动方式带来明显提效。

“通小舞”机器人执行OmniXtreme(通极)框架完成极限运动动作
让机器人完成翻腾、倒立、霹雳舞等高动态、高协调性的复杂动作一直是机器人控制领域的难题。近年来,强化学习被广泛应用于机器人控制,使机器人可以通过大量仿真训练逐渐学会复杂动作。但当动作库不断扩大时,一个新的问题也显现出来:学习的动作越多,控制精度越易下降。
与传统强化学习“从零开始训练一个统一策略”的方式不同,OmniXtreme(通极)为类人机器人高动态控制与泛化提供了一条新的技术路径,即一种两阶段学习框架。
第一阶段,研究团队首先为不同动作训练专门的“专家策略”,利用生成式建模方法,将这些专家能力融合为一个统一策略。这种方式不再把控制看作简单的函数映射,而是学习动作分布的生成过程,显著提升了策略表达能力,使系统能够同时覆盖更多类型的复杂动作。
第二阶段,在生成式策略基础上,通研院进一步引入考虑真实电机物理特性的强化学习优化,包括电机扭矩—速度关系建模、制动功率约束、更真实的执行器物理模拟。这些设计显著提升了策略在真实机器人上的可执行性,使仿真中学到的技能能够更稳定地迁移到真实机器人系统中。
实验结果表明,该方法在人形机器人多种高动态动作任务上取得了超过90%的成功率。OmniXtreme(通极)解决了动作保真度与可扩展性兼顾的难题,成为下一代人形机器人动作泛化框架,将为未来更加复杂的机器人技能学习奠定基础。(总台记者 王胜东 夏子雅)
免责声明:本站转载的文章,版权归原作者所有;旨在传递信息,不代表本站的观点和立场。