根据FOREXBNB的报道,光大证券在其研究报告中指出,当前人形机器人在平衡和运动能力方面已达到相对成熟的阶段。然而,阻碍该行业进一步增长的核心问题是训练,尤其是实现能力泛化的训练。这种泛化能力的训练需要依赖于大量的真实世界数据,而直接通过人类演示来获取这些数据成本极高,且高质量的机器人运动素材相对稀缺。英伟达(NVDA.US)的Cosmos模型能够帮助开发者生成大量合成运动数据,这可能标志着机器人物理AI时代的开启。
事件:
北京时间2025年1月7-10日,CES 2025在美国拉斯维加斯举行,英伟达CEO黄仁勋发表了开幕主题演讲,其中关于机器人的重点内容包括:
1)推出了名为Cosmos的生成式世界基础模型开发平台(World Foundation Model),并提出了“物理人工智能”(Physical AI)的概念,该平台能够生成高质量的合成数据,用于训练机器人和自动驾驶系统;
2)展示了14款人形机器人,包括银河通用G1、星动纪元Star1、智元机器人远征A2、傅里叶通用机器人GR-2、小鹏的Iron机器人等。
点评:
通常情况下,物理AI模型的开发成本非常高,需要大量的真实世界数据和测试。英伟达推出的Cosmos模型能够根据文本、图像、视频等输入组合以及机器人传感器或运动数据生成基于物理学的视频。这些模型能够实现基于物理学的交互、物体恒存性,并生成高质量的仿真工业环境(例如仓库或工厂)和驾驶环境(包括各种路况),使得机器人能够在模拟环境中更加真实地模拟物体的运动和相互作用。Cosmos模型还能与Omniverse协作,使开发人员能够更便捷地生成大量可控且逼真的合成数据,创建符合物理规律的虚拟世界,构建Physical AI机器人系统,用于训练机器人和自动驾驶,这种方法比传统数据收集方法更具成本效益。
Cosmos模型有三个版本:1)Nano(约15B,超低延迟的实时模型,适合边缘端设备部署)、2)Super(34B,高性能基线模型,支持开箱即用的微调和部署)、Ultra(约70B,准确度和质量最高,适合大规模数据中心场景)。这些模型经过了18000万亿次tokens的训练,包括2000万小时的真实世界自动驾驶、机器人、无人机镜头和合成数据,通过训练使AI理解物理世界。目前,银河通用、1X、Agility Robotics、FigureAI、小鹏、Uber等公司已经开始试用。
风险分析:存在技术落地缓慢的风险、需求不及预期的风险、人形机器人产业化进度不及预期的风险。