新华财经上海6月6日电(记者杜康)日前在2025国际人形机器人技能大赛上,记者通过现场观看各类机器人在全地形动态挑战赛、工业场景赛、家庭场景赛、商业场景赛等五大赛道28个高难度场景中的表现,发现目前机器人已逐渐摆脱了“被遥控”的状态九八策略,在复杂场景中表现出一定的自主性,比如能够自主寻找物品、归类物品等。
不过,人形机器人在精度、速度、泛化度等维度仍显笨拙。行业人士表示,训练数据的不足,是当下阻碍机器人进化的一大瓶颈。目前特斯拉、谷歌,以及国内一些机器人企业纷纷设训练场建数据集,但面临成本高、周期长等问题。合成数据作为另一条技术路线,虽也面临一些限制,不过已有完全基于合成数据训练的具身智能大模型应用落地。
处于数据“饥渴”中的具身智能
以ChatGPT、Deepseek为代表的大语言模型,其智能的涌现,离不开巨量的文本数据。具身智能模型能力的提升,同样有赖于大量训练数据的输入。不过,与文本数据相比,具身智能的训练数据十分稀缺,尤其是多模态数据。“数量上可能有百万倍的差距。”中国工程院外籍院士张建伟说。
训练数据的不足,可以说是当前具身智能“脑部”进化的“阿喀琉斯之踵”。
为了解决训练数据的缺乏九八策略,机构和企业纷纷行动。比如,特斯拉Optimus的训练数据是让人在远程操作机器人的过程中,将操作动作和环境感知数据进行记录;谷歌DeepMind 联手斯坦福大学等推出了Open X-Embodiment Dataset,包含100 多万条真实机器人轨迹。国内人形机器人头部企业智元也发布了百万真机数据集开源项目AgiBot World。
不过,百万体量的数据,对于训练具身智能大模型来说,远远不够。
“头部车厂每天回流的数据在1亿条左右。但在具身智能领域,如今我们采集到的最大数据集也只有百万条规模。当人形机器人的存量尚未达到自动驾驶领域百万级设备的规模时,依赖海量真实数据训练不仅成本高昂,而且周期冗长,极大制约了大模型的训练效率与场景适应能力。”北京银河通用机器人有限公司创始人兼CTO王鹤说。
数据不够,就难以训练出好用的大模型,具身智能难以广泛落地;如果没有落地,“数据飞轮”难以形成,模型优化迭代缓慢。“我们不可能把一个半成品交付给客户,期待用户能够为机器人公司提供数据。”有行业人士表示,这似乎陷入了一个“鸡生蛋”还是“蛋生鸡”的窘境。
合成数据“纯粹版”具身智能大模型商用落地
行业解决数据难题的路径之一九八策略,是合成数据。合成数据(Synthetic Data)是一种模仿真实世界数据的非人工创建的数据,它是由基于生成式人工智能技术的计算算法和模拟创建而成。近年来,随着ChatGPT的火爆和生成式人工智能技术的发展,合成数据概念受到越来越多的关注。
前不久举办的2025张江具身智能开发者大会上 ,银河通用通过几款完全基于合成数据的端到端抓取基础大模型 GraspVLA,以及导航大模型,展示了合成数据的价值。
据悉, GraspVLA采用了10亿级别的合成大数据进行训练。目前银河通用安装了上述大模型的人形机器人已经用于24小时无人药店。“40多平方米的药店里面,有5000多种药品,6000多个货道,可全都由机器人完成取货,打包后送至外卖柜等待上门领取。”王鹤介绍,目前由人形机器人运营的24小时无人药店已有6家在北京实现常态化运营,今年年底预计全国扩张至100家。
当然,合成数据方法并非没有局限性。虽然目前生成视觉数据的能力相对成熟,但生成其他模态的数据,包括触觉、温度和声音数据等,仍然是一项重大挑战。此外,关于合成数据路线,行业也有不少担忧,比如“Sim2Real Gap”,也即仿真环境与真实世界匹配度不够,导致合成数据训练存在有效性问题。
有行业人士表示,在具身智能模型的训练过程中,一个关键步骤是“模拟到现实”迁移,即将从模拟数据中学习到的技能迁移到现实世界的应用中。“为了增强‘模拟到现实’的能力,我们需要尽量缩小模拟环境与物理环境之间的差距,并确保生成的数据符合物理规律。目前,人工智能还无法完全理解物理规律,因此引入相关的约束至关重要。”
虚拟、现实两手抓国地中心突围异构难题
“受限于手段和成本,当前合成数据规模远远大于真机数据,是非常重要的一条技术路线。”国地共建人形机器人创新中心(下简称“国地中心”)首席科学家江磊表示。不过,在合成数据之外,国地中心还在探索如何更好在数字世界和物理世界之间建立链接。今年1月份,国地中心具身智能训练场启动,100多台全尺寸人形机器人进驻。
此前,虽然已有智元、傅利叶等头部人形机器人公司开放数据集,但记者了解到,这些开放的数据集很难为其他机器人公司所用。“因为数据都是与本体强绑定的。”有业内人士对记者表示,由于当前机器人形态构造有很大差异,训练数据难以互通。
国地中心试图解决异构数据互通这个行业痛点。“我们通过仿真平台,注册机器人的本体和传感器位置来对齐数据。同时,通过仿真平台的AI算法把不同的结构重新映射给需要的机器人平台。”江磊说,届时可避免行业对机器人一些基础功能的重复训练。
江磊介绍,国地中心已经推出的“格物-致知”具身智能开发平台九八策略,收集100多款机器人构型,预计在今年7月份的WAIC期间,会有多项重要成果发布。
银河配资提示:文章来自网络,不代表本站观点。