注册

英伟达官宣推出全球首款完全开放的全模态物理AI模型NVIDIA Cosmos 3

来源:科创板日报       

2026中国台北GTC大会正式启幕,英伟达在现场主题演讲中对外官宣NVIDIA Cosmos 3全模态物理AI基础模型,并同步发起成立NVIDIA Cosmos Coalition全球开发者协作联盟,全面推进物理AI技术生态建设与产业化落地。

据英伟达官方披露资料,Cosmos 3为全球首款实现完全开放的全模态物理AI基础模型,产品依托自研混合Transformer架构搭建,整合推理与生成双分支模块,单模型一体化落地视觉推理、世界生成、动作预测三项核心功能,可精准复刻重力、碰撞、摩擦等现实物理规则。区别于主打文娱内容生成的通用多模态大模型,该产品原生兼容文本、图像、视频、环境音、人体及机械动作五大模态的输入与生成,依托海量物理标注数据集完成预训练,能够自主生成符合现实规律的场景数据与运动轨迹。

官方资料显示,Cosmos 3规划多梯度产品版本,其中Super大参数版本面向车企、人形机器人企业,用于大规模数据合成与高阶算法研发;Base标准版适配全行业中小研发团队;Tiny轻量化版本主打边缘嵌入式硬件本地部署。英伟达已将模型权重、源代码、配套评测数据集全量对外开放,相关资源陆续上架Hugging Face、GitHub等开源平台,全球开发者可免费获取并按需微调优化。从落地效率来看,依托该模型,机器人、自动驾驶、工业数字孪生项目传统数月的仿真调试周期可压缩至数天,有效降低物理AI研发的数据采集与测试投入成本。

在产品发布同期,英伟达官宣落地生态布局,牵头组建NVIDIA Cosmos Coalition全球协作联盟,首批创始成员囊括Agile Robots、Black Forest Labs、Runway、LTX、Skild AI等海内外头部AI实验室与机器人企业。按照联盟合作规则,成员机构可共享Cosmos 3全套技术栈,按需使用英伟达DGX Cloud云端算力资源,各方互通算法、测试基准与行业实测数据,协同制定开放世界模型通用开发规范,合力加速下一代物理AI技术迭代与商业化落地。

公开信息显示,目前已有多家车企、自动化设备厂商启动基于Cosmos 3的项目内测,产品落地场景覆盖人形机器人研发、车载自动驾驶仿真、工厂工业视觉检测、写实数字内容制作等领域。