百万奖金池!人形机器人运控、VLA项目,这次可以真上手了
这次北京人形和百度智能云做的是“开源开放共创共赢”具身智能黑客松赛事。
我第一眼还是看工具链。百万奖金池、冠军队伍给具身天工3.0本体,这些当然吸引人;但对开发者来说,真正能留下来的,是这套开源链路能不能被外部团队跑通。
核心看点很直接:北京人形正在把RoboMIND、x-humanoid-training-toolchain、TienKung-Lab、xGMR、xSIM_MUJOCO、Deploy_Tienkung、xMIMIC,以及具身天工和慧思开物两大平台,放进同一场开发者实战。
这比“又办了一场比赛”更值得写。过去很多具身活动的视频很好看:能跑、能跳、能抓。但开发者真要上手,问题会马上变成一堆很具体的东西:数据怎么转,仿真怎么训,策略怎么部署,模型怎么接真实机器人,最后怎么证明能力可以复现。
这场黑客松最值得盯的,就是这条链路能不能被外部团队跑通。
01这场比赛要验证一条开源链路
从赛事资料看,“开源开放共创共赢”具身智能黑客松赛事设置了两个主赛道:运动控制Locomotion和VLA模型微调Manipulation,后面还留了一个隐藏赛道。
这个拆法很有指向性。
一边是人形机器人最底层的身体能力:能不能稳定走、能不能跑、能不能过复杂地形、能不能从仿真迁移到真实机器人。另一边是上层操作能力:模型能不能理解视觉和语言,把指令变成机器人能执行的动作。
这两个赛道放在一起,刚好对应具身智能现在最难打通的两层:下层要有可靠身体,上层要有可执行意图。
运动控制强,机器人才能稳;VLA接得上,机器人才能按任务行动。走到产业场景,这两层必须同时过关。
所以我更愿意把这场比赛看成一次开源工具链实战:参赛团队基于北京人形的具身天工和慧思开物两大通用平台,再叠加百度智能云的算力、数据和AI基础设施,把算法构想推到可运行结果。
报名和入群二维码我放在文末,方便直接保存或转发。后面先继续拆这场比赛背后的两条技术线。
02运动控制赛道:从“能跑”到“能迁移”
运动控制赛道围绕具身天工机器人平台展开,资料里提到的关键工具包括TienKung-Lab、xGMR、xMIMIC、xSIM_MUJOCO和Deploy_Tienkung。
这几个名字放在一起,其实已经能看出北京人形想搭的运控链路:先把人体动捕或视频动作转成机器人可用的专家轨迹,再在IsaacLab体系里做强化学习训练,接着用MuJoCo做Sim2Sim验证,最后走部署工具链把策略推到真实机器人上。
如果想顺着代码看,几个入口可以直接看GitHub:TienKung-Lab、xGMR、xSIM_MUJOCO、Deploy_Tienkung。
这里最值得注意的是TienKung-Lab。
北京人形此前已经把它开源出来。按照官方仓库介绍,TienKung-Lab是一套面向天工全尺寸人形机器人的强化学习运动控制框架,基于IsaacLab,结合AMP风格奖励和周期性步态奖励,用来训练自然、稳定、高效的走路和跑步策略;同时支持迁移到MuJoCo做Sim2Sim交叉验证,并已经在真实天工机器人上验证。
这里还可以多看一层。赛事资料把xMIMIC也写进了平台工具链。它是面向机器人高动态技能的动作训练框架,支持托马斯旋转、舞蹈、跑酷等动作训练,并把模仿学习与强化优化放进同一套训练流程里。
这件事很适合放在运动控制赛道里讲。人形机器人运控后面会越来越多地走向高动态动作、复杂技能复现和动作库扩展。TienKung-Lab更像基础运控训练框架,xMIMIC则会把高动态技能训练这块补上。
这也是我关注这个赛道的原因。
参赛队伍要面对的重点,会是策略从仿真训练推进到真实部署链路的能力。跑出一个高分还不够,策略要能在不同环境、不同扰动、不同验证方式里站住。
TienKung-Lab仿真与Sim2Sim训练画面
这也是人形机器人运控现在最现实的门槛。
会走、会跑当然重要,但对开发者来说,更关键的问题是:这套能力能不能被复现、能不能被调试、能不能被迁移、能不能被别人接着做。
开源框架的价值就在这里:它把一部分训练路径、验证路径和部署路径暴露给社区,让外部团队有机会沿着同一条链路继续做。
03VLA微调赛道:RoboMIND要进入真实训练流程
另一个赛道是VLA模型微调,聚焦Manipulation。赛事资料把这个赛道的任务写得更清楚:围绕通用场景下的自主控制和任务执行,攻克物体分类与复杂操控,在线上仿真和线下真机中验证高效的“视-言-行”闭环。
这个赛道用到的核心资源,可以理解成一条更清楚的训练链路:RoboMIND提供机器人操作数据,官方VLA仿真环境和专属任务数据集提供验证场景,x-humanoid-training-toolchain负责把数据适配到LeRobot生态,再进一步服务天工机器人的具身操作能力训练。
RoboMIND的定位也需要更新一下。早期V1.0版本强调10万余条轨迹、479项跨场景任务,覆盖多类物体和操作任务;但现在更适合从整个系列来看。
按照北京人形给出的说法,RoboMIND是标准化、大规模、多本体、多模态的机器人操作数据集,系列累计数据量已经达到40余万条,下载量突破600万次。RoboMIND 2.0还进一步集成了双臂移动平台、灵巧手操作、触觉数据,并配套高保真仿真环境和评测开源。
这比单纯写“10万条数据”更重要。它说明RoboMIND已经从一个静态数据包,继续往多本体、多模态、可评测、可训练的方向扩展。
但数据集难用的地方,经常卡在“最后一公里”。
更麻烦的是数据格式、训练框架、机器人硬件之间的适配成本。很多时候,数据在论文里看起来很丰富,但开发者真要拿来训练模型,会卡在格式转换、字段解析、相机流、关节数据、动作序列和框架接口这些细节上。
所以我更愿意把x-humanoid-training-toolchain看成一个训练入口,而不是只看仓库数量。
它把RoboMIND的HDF5数据转换到LeRobotDataset V2.1格式,让开发者能用LeRobot生态里的训练脚本继续做ACT、Diffusion Policy等模型训练。这个动作看似工程,其实很关键:数据只有进入主流训练框架,才会被社区反复使用。
这部分对应的代码入口是x-humanoid-training-toolchain。如果后续要判断RoboMIND能不能被开发者长期用起来,我会优先看这个仓库的算法适配、数据转换和示例任务能不能持续补齐。
RoboMIND与LeRobot工具链可视化画面
VLA赛道考察的,也不该停在“模型看懂一句话”。
更关键的是:给定视觉输入和语言目标后,模型能不能生成可执行动作,并在仿真或真机环境里完成任务。换句话说,这个赛道要补的是视觉、语言、动作之间的工程接口。
这个接口一旦跑通,RoboMIND的价值就会从“数据下载量”变成可复现、可微调、可验证的训练资产。
04百度智能云:算力之外,是训练基础设施
这次比赛另一个重要角色是百度智能云。
云厂商参与比赛,很容易被理解成算力支持。但具身智能里的算力问题,比普通模型训练更复杂。
具身任务往往会同时涉及模型训练、数据管理、仿真任务、评测脚本、反复实验、版本回滚和团队协作。尤其是VLA、VLM、世界模型、强化学习策略这些方向叠在一起后,开发者需要的是一套稳定的训练与实验基础设施。
资料里提到,百度百舸平台通过自动弹性容错机制,保障千卡规模集群模型有效训练时长占比99.5%,并支持VLA、VLM和世界模型训练与仿真,同时提供开发机、数据集等产品能力。这个对参赛队伍的实际意义是:减少非算法环节的消耗,让团队把精力更多放在模型和策略本身。
这也是为什么我觉得这场黑客松适合高校实验室、创业团队和工程型开发者参加。
这场比赛会拼想法,也会拼落地链路。谁能更快把数据、框架、仿真、部署和评测串起来,谁就更容易把想法变成可运行成果。
05我看重的,是这套开源生态开始闭环
把北京人形最近几条线放在一起看,会比较清楚。
RoboMIND解决的是数据来源;x-humanoid-training-toolchain解决的是数据进入LeRobot训练框架;TienKung-Lab解决的是运动控制训练;xGMR、xSIM_MUJOCO和Deploy_Tienkung继续往动作重定向、仿真验证和真机部署走;后续xMIMIC则会补上高动态技能训练;这次黑客松则把这些东西放进一个外部开发者可以参与的任务场。
这条链路跑起来之后,对生态的意义会大于单点开源。
具身智能开发者最需要的是一条可执行路径:从哪里拿数据,怎么处理,怎么训练,怎么验证,怎么迁移,最后怎么在机器人上跑起来。
这次比赛最值得看的,就是这个闭环能不能被更多外部团队跑通。
当然,我也不会把它说得过满。具身智能还远没有到“工具链一开源,生态就自动繁荣”的阶段。开发者实际使用时,肯定还会遇到环境配置、仿真参数、真机安全、数据质量、任务定义和模型泛化这些问题。
,时长01:40
但至少,这次北京人形把数据、训练适配、运动控制、仿真验证、真机部署、机器人平台、云基础设施和赛事任务放到了一起,还把这些资源放进了一个外部团队可以报名、提交、答疑、初赛、决赛的流程里。
对具身智能开发者来说,这比单纯看demo更实在。
06赛事信息
这次“开源开放共创共赢”具身智能黑客松赛事由北京人形和百度智能云共同打造,面向高校实验室、科技企业、创业团队和全球开发者开放。
•赛道一:运动控制Locomotion
聚焦稳定行走、复杂地形、动作迁移、Sim2Real部署、抗扰恢复、动作模仿与泛化等方向。
•赛道二:VLA模型微调Manipulation
聚焦物体识别与抓取、单臂或双臂协作、工具使用、目标放置、语言指令驱动的多步骤操作,以及开放场景下的泛化执行。
•报名及赛队征集:截止至6月20日
•线上初赛及赛事答疑:截止至7月底
•线下决赛及巅峰对决:截止至8月中旬
赛事资料里还提到:奖金池价值百万;冠军队伍可获得具身天工3.0本体一台;决赛优秀队伍可获得世界人形机器人运动会参赛本体和技术支持;提交作品并通过审核,可获得具身天工3.0本体代金券+实物奖励;报名并提交作品后,可以申请百度智能云算力资源包。
报名入口:扫码提交赛事报名信息。
具身智能黑客松报名二维码
入群入口:扫码加入官方赛事通知飞书群,抢先拿资料、找队友请用飞书app扫码。
官方赛事通知飞书群二维码
如果你对RoboMIND、TienKung-Lab、VLA微调、Sim2Real或具身智能开发感兴趣,这场比赛确实值得看一下。
07相关链接
•开源社区组织主页:https://github.com/Open-X-Humanoid
•X-Humanoid training toolchain:https://github.com/Open-X-Humanoid/x-humanoid-training-toolchain
•TienKung-Lab:https://github.com/Open-X-Humanoid/TienKung-Lab
•xGMR:https://github.com/Open-X-Humanoid/xGMR
•xSIM_MUJOCO:https://github.com/Open-X-Humanoid/xSIM_MUJOCO
•Deploy_Tienkung:https://github.com/Open-X-Humanoid/Deploy_Tienkung
•RoboMIND V1.0:https://huggingface.co/datasets/x-humanoid-robomind/RoboMIND
•RoboMIND V2.0:https://modelscope.cn/datasets/X-Humanoid/RoboMIND2.0
https://mp.weixin.qq.com/s/ONRCISLiY0dH8CQ8Ri7Rsg
苏公网安备32021402002828