根據FOREXBNB的報道,光大證券在其研究報告中指出,當前人形機器人在平衡和運動能力方面已達到相對成熟的階段。然而,阻礙該行業進一步成長的核心問題是訓練,尤其是實現能力泛化的訓練。這種泛化能力的訓練需要依賴大量的真實世界數據,而直接透過人類演示來取得這些數據成本極高,且高品質的機器人運動素材相對稀缺。英偉達(NVDA.US)的Cosmos模型能夠幫助開發者產生大量合成運動數據,這可能標誌著機器人物理AI時代的開啟。
事件:
北京時間2025年1月7-10日,CES 2025在美國拉斯維加斯舉行,英偉達CEO黃仁勳發表了開幕主題演講,其中關於機器人的重點內容包括:
1)推出了名為Cosmos的生成式世界基礎模型開發平台(World Foundation Model),並提出了“物理人工智慧”(Physical AI)的概念,該平台能夠產生高品質的合成數據,用於訓練機器人和自動駕駛系統;
2)展示了14款人形機器人,包括銀河通用G1、星動紀元Star1、智元機器人遠徵A2、傅立葉通用機器人GR-2、小鵬的Iron機器人等。
點評:
通常情況下,物理AI模型的開發成本非常高,需要大量的真實世界數據和測試。英偉達推出的Cosmos模型能夠根據文本、影像、視頻等輸入組合以及機器人感測器或運動數據生成基於物理學的視頻。這些模型能夠實現基於物理學的交互、物體恆存性,並產生高品質的模擬工業環境(例如倉庫或工廠)和駕駛環境(包括各種路況),使得機器人能夠在模擬環境中更真實地模擬物體的運動和相互作用。Cosmos模型還能與Omniverse協作,使開發人員能夠更便捷地產生大量可控且逼真的合成數據,創造符合實體規律的虛擬世界,建構Physical AI機器人系統,用於訓練機器人和自動駕駛,這種方法比傳統資料收集方法更具成本效益。
Cosmos模型有三個版本:1)Nano(約15B,超低延遲的即時模型,適合邊緣端設備部署)、2)Super(34B,高性能基線模型,支援開箱即用的微調和部署)、Ultra(約70B,準確度和品質最高,適合大規模資料中心場景)。這些模型經過了18000兆次tokens的訓練,包括2000萬小時的真實世界自動駕駛、機器人、無人機鏡頭和合成數據,透過訓練使AI理解物理世界。目前,銀河通用、1X、Agility Robotics、FigureAI、小鵬、Uber等公司已經開始試用。
風險分析:存在技術落地緩慢的風險、需求不如預期的風險、人形機器人產業化進度不如預期的風險。