国产全功能GPU首次全栈支撑世界模型原生训练：北大 EvoPhys-World 登顶 WorldScore

来源： 2026-06-08 23:20:08

近日，北京大学 EvoPhys 团队推出以“人”为中心、面向“场景级万物可控”的 5D 世界模型 EvoPhys-World。据斯坦福大学 WorldScore 公开评测榜单，截至发稿时，EvoPhys-World 在世界生成（World Generation）评测中位列第一。这一国际前沿成果全程在摩尔线程 MTT S5000 全功能 GPU 上完成原生训练，并由 MUSA 软件栈提供全栈支撑。

标题: figure - 说明 figure

WorldScore 实时榜单：EvoPhys-World 位列第一

排名公示链接：https://huggingface.co/spaces/Howieeeee/WorldScore_Leaderboard

从像素到物理，从“看见世界”到“撬动世界”，世界模型正在重塑 AI 理解物理世界、迈向具身智能的根本范式；在通用人工智能的版图中，它已成为检验算法创新与算力能力的试金石。EvoPhys 团队的此次突破，正是中国科研力量在这一前沿方向上的有力探索。

模型能力与技术细节详见项目主页：https://evophys.com

世界模型：AI 走进物理世界的试金石

过去一年，AI 正从数字世界加速走进物理世界，而能否真正“理解并撬动世界”，是这一进程绕不开的命题。一系列公开工作已能构建连续、逼真的虚拟世界，但“可操控、可交互”仍是行业的开放课题——生成的世界大多更擅长“看”，而较少能真正“动”。

EvoPhys-World 的特殊之处，正在于把 AI 生成的世界从“可观看、可漫游、浅交互”，推进到“可操控、深交互、自进化”：它以“人”为中心，将第一视角下的人类观察与手部交互作为通用动作表征，从大规模原始无标注人手 EGO 数据中学习；并以 World Engine（万物可孪生、物理可交互） 与 World Policy（世界可预演、万物可操控） 两种形态，构成从“生成世界”到“操控世界”的完整闭环。

EvoPhys-World 模型架构图

这一前沿探索的国际能见度，也得到了第三方公开评测的印证：在斯坦福大学提出、发表于 ICCV 2025 的世界生成统一评测基准 WorldScore 上，截至本文发布时，EvoPhys-World位列世界生成评测第一。

国产算力护航：MTT S5000 全功能 GPU 与 MUSA 软件栈全程支撑前沿世界模型训练

世界模型是对算力与软件栈的双重考验。面向约 4 万小时纯人手 EGO 数据，EvoPhys-World 需要在长时序第一视角交互数据中，同时建模时空记忆、状态预测、动作预测、物理交互与策略演化，对训练稳定性、数据吞吐与软硬件协同效率提出了很高要求。

作为摩尔线程旗舰级 AI 训推一体全功能 GPU 智算卡，MTT S5000 专为大模型训练与推理设计；依托 MUSA 软件栈的高兼容性与开放架构，摩尔线程为 EvoPhys 团队训练 EvoPhys-World 这类新型世界模型提供了全栈支撑：

全功能 GPU 算力底座：MTT S5000 面向大模型训练与推理负载，结合架构层面的计算单元协同与原生 FP8 等多精度训练能力，为前沿模型训练提供底座算力。
MUSA 软件栈全方位支持：从分布式训练框架、丰富的算子支持，到高效的卡间通信与软硬件协同优化，MUSA 软件栈支撑了这一以扩散式生成为核心、融合多模态时空建模的新型世界模型，从适配到稳定训练的全链路落地。
大规模稳定扩展：依托高效的卡间通信与并行策略，MTT S5000 集群在长时序、高负载的世界模型训练中保持稳定运行与大规模扩展能力。

这意味着，国产全功能 GPU 不仅能“跑得起来”前沿世界模型，更能在软硬件深度协同下，支撑其从研发探索走向规模化训练。

软硬协同的训练成绩单

EvoPhys-World 全程在 MTT S5000 上原生训练，在训练负载的实验室验证中，MTT S5000 交出了一份兼顾扩展性、对齐性与生成质量的成绩单：

大规模近线性扩展：训练吞吐在从单机到 20 节点规模的扩展中保持近线性增长，多机区间弱扩展效率保持在约 90% 水平，验证了国产算力平台在大规模世界模型训练上的可扩展性。

标题: figure - 说明 figure

图 1 · MTT S5000 多机弱扩展效率（以 16 卡为基准）：从单机到 20 节点（160 卡），训练吞吐保持近线性扩展，弱扩展效率约 90%。数据来自北京大学 EvoPhys 团队实测。

与国际主流 GPU 性能接近：在对齐验证条件下，MTT S5000 与国际主流产品的训练吞吐基本持平、多机扩展效率曲线趋势接近。

标题: figure - 说明 figure

图 2 · 对齐验证条件下，MTT S5000 与国际主流产品的多机扩展效率曲线趋势接近。数据来自北京大学 EvoPhys 团队实测。

规模	MTT S5000 相对训练吞吐
1 机 / 8 卡	100%
2 机 / 16 卡	101%
4 机 / 32 卡	98%

表 1 · 对齐验证条件下相对训练吞吐（以国际主流产品为 100%）：MTT S5000 与国际主流产品基本持平。数据来自北京大学 EvoPhys 团队实测。

生成质量定性一致：在相同初始帧、相同 prompt 的推理设置下，基于国产算力训练所得模型与基于国际主流产品训练所得模型，生成的第一视角人手操作视频在抓握姿态、书写笔迹、手—物接触与物理反馈上定性一致，无明显结构崩坏或时序断裂。

全链路闭环：让前沿世界模型在国产算力上自主生长

一次成功的前沿模型训练，背后是一条完整的自主链路。摩尔线程与北京大学的此次协同，推动了“前沿模型 — 本土软件栈（MUSA）— 国产算力（MTT S5000）— 开发者与产业工作流”的全链路闭环。

对国内高校、科研机构与具身智能团队而言，这条闭环意味着在算力可得性、软硬件自主性与长期迭代能力上拥有更高的自主权，从而加速从前沿探索到产业落地的全流程。国产算力的命题，正在从“能不能训练模型”，走向“能不能训出在国际前沿评测中位居前列的模型、并让这套能力自主、可控地持续生长”——这也是国产软硬件生态从“可用”迈向“好用”与“领先”的关键一跃。

摩尔线程“灯塔计划“全力支持中国科学家做出世界领先的原创成果

EvoPhys-World 的此次突破，也是摩尔线程“灯塔计划”支持下的一项标杆成果。“灯塔计划”是摩尔线程面向全球科研机构推出的算力支持与协作计划，为具有创新性、前沿性的科研项目提供优惠算力以及工程、生态资源，助力科学家突破资源瓶颈、聚焦核心问题、加速原创突破。摩尔线程希望以国产芯片与国产软件栈为底座，支持中国科学家做出世界领先的原创成果——本次与北京大学 EvoPhys 团队的协同，正是“灯塔计划”的一次生动实践。

结语：从“看见世界”到“改变世界”

物理世界的数字镜像，正在被逐层理解、逐步“撬动”。世界模型的竞争，正从“谁生成得更逼真”，走向“谁更懂物理、谁更会交互、谁能自我进化”；而支撑这场竞争的算力底座由谁来筑、能否自主可控，同样是一道必答题。

在 AI 走进物理世界的时代浪潮中，摩尔线程愿与高校、科研机构及广大开发者一道，以全功能 GPU 与 MUSA 软件栈为坚实底座，并通过“灯塔计划”持续为前沿科研提供算力与工程支持，在从“看见世界”到“改变世界”的未竟之路上，助力更多科学家突破核心技术、推动产业高质量发展。

【免责声明】

1、「DRAMeXchange-全球半导体观察」包含的内容和信息是根据公开资料分析和演释，该公开资料，属可靠之来源搜集，但这些分析和信息并未经独立核实。本网站有权但无此义务，改善或更正在本网站的任何部分之错误或疏失。
2、任何在「DRAMeXchange-全球半导体观察」上出现的信息（包括但不限于公司资料、资讯、研究报告、产品价格等），力求但不保证数据的准确性，均只作为参考，您须对您自主决定的行为负责。如有错漏，请以各公司官方网站公布为准。
3、「DRAMeXchange-全球半导体观察」信息服务基于"现况"及"现有"提供，网站的信息和内容如有更改恕不另行通知。
4、「DRAMeXchange-全球半导体观察」尊重并保护所有使用用户的个人隐私权，您注册的用户名、电子邮件地址等个人资料，非经您亲自许可或根据相关法律、法规的强制性规定，不会主动地泄露给第三方。

「DRAMeXchange-全球半导体观察」所刊原创内容之著作权属于「DRAMeXchange-全球半导体观察」网站所有，未经本站之同意或授权，任何人不得以任何形式重制、转载、散布、引用、变更、播送或出版该内容之全部或局部，亦不得有其他任何违反本站著作权之行为。

国产全功能GPU首次全栈支撑世界模型原生训练：北大 EvoPhys-World 登顶 WorldScore

世界模型：AI 走进物理世界的试金石

国产算力护航：MTT S5000 全功能 GPU 与 MUSA 软件栈全程支撑前沿世界模型训练

软硬协同的训练成绩单

全链路闭环：让前沿世界模型在国产算力上自主生长

摩尔线程“灯塔计划“全力支持中国科学家做出世界领先的原创成果

结语：从“看见世界”到“改变世界”

相关文章

每日行情

主编推荐

研究报告