Day-0支持｜摩尔线程率先完成MiniMax M3大模型适配

来源： 2026-06-13 12:09:19

6月12日，MiniMax新一代原生多模态旗舰模型 M3正式开源。同日，摩尔线程旗舰级AI训推一体智算卡MTT S5000已完成对该模型的Day-0极速适配。这是国产大模型与国产算力芯片完成适配的又一例证，也彰显了摩尔线程凭借原生FP8算力底座与高效MUSA软件生态，对前沿大模型需求的即时响应与稳定支撑能力。

▼ MiniMax M3开源地址：

https://huggingface.co/MiniMaxAI/MiniMax-M3

▼ 开发者可下载镜像进行开箱体验：

registry.mthreads.com/mcconline/inference/vllm:v0.20.0-ph1-4.3.5-torch2.9-20260605-mtcc51

MiniMax M3是目前国内唯一同时具备前沿Coding & Agentic能力、超长下文与原生多模态的开源大模型，也是第一个将完整frontier能力带入开放世界的模型。该模型基于自研MSA（MiniMax Sparse Attention）架构，可将上下文窗口扩展至1M级别，并在BrowseComp、SWE-Bench Pro等国际权威评测中达到前沿水平。作为原生多模态模型，M3重构了整个数据管线，从第零步开始多模态训练，使文本和视觉语义空间高度对齐。

图示：MiniMax M3的Coding & Agentic能力在软件工程、终端执行、工具调用等多维度权威评测中达到前沿水平。

针对MiniMax M3的核心技术特性，MTT S5000从硬件算力、软件栈到开源框架进行了全链路精准匹配与深度优化：

▼ 支撑超长上下文：高密度算力与大显存提供坚实支撑。

MSA架构带来的超长上下文窗口，对推理阶段的KV Cache存储和访存带宽提出了极高要求。MTT S5000凭借硬件级原生FP8加速，单卡AI算力（稠密）高达1000 TFLOPS；同时配备80GB大容量显存与1.6TB/s的超高带宽，为百万token级长序列提供充足的缓存空间与卓越的数据吞吐能力。此外，依托MUSA C++与Triton-MUSA等抽象层，M3的新算子结构可实现快速迁移，确保摩尔线程平台能够快速完成架构适配。

▼ 赋能前沿Coding与Agentic能力：实现低延迟、高吞吐的推理优化。

面向M3重点强化的编程与智能体场景，摩尔线程基于此前对DeepSeek-V4、MiniMax M2.7、GLM-5.1等多款国产旗舰模型的Day-0适配经验，已形成一套高效、系统化的复杂推理任务优化方法论。本次适配通过原生算子定制，在保障模型精度无损的前提下，显著提升推理吞吐、降低响应延迟；同时，摩尔线程完成了vLLM与SGLang两大主流推理框架的同步拉起，以MUSA开放架构拥抱开源生态，为开发者提供灵活多样的部署选择。

▼ 推动原生多模态推理：覆盖全精度与贯通全场景。

M3作为从Step 0即进行多模态混合训练的模型更适配当下Agentic AI多元场景的需求，同时这也要求算力底座具备多元化算力。MTT S5000智算卡覆盖从FP8至FP64全计算精度，可无缝适配从模型研发到商业化落地的完整链路，助力国产旗舰大模型快速完成生态普及。

随着MiniMax M3在MTT S5000上完成适配，开发者现在即可基于MUSA软件栈与vLLM/SGLang双框架完成部署，并持续获得算子级性能优化。依托MUSA架构对主流AI生态的深度兼容与持续演进，摩尔线程已具备覆盖前沿模型“适配—部署—优化”的完整工程能力，帮助开发者以更快响应、更稳运行、更低迁移成本接入最新模型能力，加速大模型创新落地与规模化应用。

【免责声明】

1、「DRAMeXchange-全球半导体观察」包含的内容和信息是根据公开资料分析和演释，该公开资料，属可靠之来源搜集，但这些分析和信息并未经独立核实。本网站有权但无此义务，改善或更正在本网站的任何部分之错误或疏失。
2、任何在「DRAMeXchange-全球半导体观察」上出现的信息（包括但不限于公司资料、资讯、研究报告、产品价格等），力求但不保证数据的准确性，均只作为参考，您须对您自主决定的行为负责。如有错漏，请以各公司官方网站公布为准。
3、「DRAMeXchange-全球半导体观察」信息服务基于"现况"及"现有"提供，网站的信息和内容如有更改恕不另行通知。
4、「DRAMeXchange-全球半导体观察」尊重并保护所有使用用户的个人隐私权，您注册的用户名、电子邮件地址等个人资料，非经您亲自许可或根据相关法律、法规的强制性规定，不会主动地泄露给第三方。

「DRAMeXchange-全球半导体观察」所刊原创内容之著作权属于「DRAMeXchange-全球半导体观察」网站所有，未经本站之同意或授权，任何人不得以任何形式重制、转载、散布、引用、变更、播送或出版该内容之全部或局部，亦不得有其他任何违反本站著作权之行为。

Day-0支持｜摩尔线程率先完成MiniMax M3大模型适配

▼ 支撑超长上下文：高密度算力与大显存提供坚实支撑。

▼ 赋能前沿Coding与Agentic能力：实现低延迟、高吞吐的推理优化。

▼ 推动原生多模态推理：覆盖全精度与贯通全场景。

相关文章

每日行情

主编推荐

研究报告