科技

MiniMax M3正式发布:首个三项能力兼备的国产旗舰,百万上下文+原生多模态+前沿编程

6月1日,国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention(MSA),是国内首个同时具备「前沿Coding能力、1M超长上下文、原生多模态」三项核心能力的大模型,也是目前全球唯一具备完整能力组合的开源选项。

MSA架构:百万token上下文的秘密

MSA的核心设计是在标准GQA骨干上采用区块级选择,注意力直接在未压缩的真实Key-Value上计算。在100万上下文规模下,M3单token计算量仅为上一代模型的约1/20,推理效率显著提升。MiniMax在底层推理算子层面也进行了优化,相关性能较主流开源方案提升4倍以上。

Coding & Agent能力:SWE-Bench Pro超越GPT-5.5

M3在编码与智能体评测中达到行业顶尖水平:SWE-Bench Pro上超过GPT-5.5和Gemini 3.1 Pro,接近Opus 4.7。SVG-Bench上超越Opus 4.7。OmniDocBench上超越Gemini 3.1 Pro。BrowseComp智能体评测中以83.5分超越Opus 4.7的79.3分。Claw-Eval端到端评测中获得最高分。

M3在编程与Agent训练中创新引入交互式用户模拟器框架——通过模拟真实开发者在协作过程中的行为模式,让模型在训练阶段就接触到更接近生产环境的交互场景。写出的代码目标是直接可交付,而不是「能跑但需要人改」。

原生多模态:从Step 0开始混合训练

M3从Step 0开始进行多模态混合训练,文本、图片、视频等多模态数据在序列中交替自然排列。MiniMax重构了整套数据管线,将预训练数据规模扩充至100万亿token量级。模型不仅支持图像与视频理解,也具备桌面操作能力,可在复杂跨应用环境中执行Computer Use任务。

12小时无人干预:自主复现ICLR论文

MiniMax官方丢给M3一篇ICLR 2025杰出论文,让它独立复现。M3连续运行近12小时,全程自主产出18次commit与23张实验图表,成功跑通核心实验。另一个测试:给M3四个只完成预训练的Base模型,要求12小时内自主完成数据合成、训练、评测、迭代全流程,M3最终得分37.1,位列第三,仅次于Opus 4.7(42.4)和GPT-5.5(39.3)。

Token Plan订阅:Plus 49元/月起

MiniMax同步推出Token Plan订阅方案:Plus版每月49元提供6亿token,Max版每月119元提供18亿token,Ultra版每月469元提供55亿token。M3 API已上线,上下文≤512K价格7天限时五折。即将在HuggingFace和GitHub上开源。

A股上市同步推进

MiniMax已于5月29日向上海证监局提交上市辅导备案报告,中信证券担任辅导机构。港股上市以来股价最高触及1330港元,市值一度超2600亿港元。与智谱一同冲刺A股大模型第一股。