科技

MiniMax M3正式发布：首个三项能力兼备的国产旗舰，百万上下文+原生多模态+前沿编程

📅 2026-06-01 10:29 · 👁 392 次阅读 · 📝 1,277 字 · ⏱ 约 5 分钟读完

6月1日，国产大模型公司MiniMax正式发布新一代通用模型MiniMax M3。M3采用全新的自研稀疏注意力架构MiniMax Sparse Attention（MSA），是国内首个同时具备「前沿Coding能力、1M超长上下文、原生多模态」三项核心能力的大模型，也是目前全球唯一具备完整能力组合的开源选项。

MSA架构：百万token上下文的秘密

MSA的核心设计是在标准GQA骨干上采用区块级选择，注意力直接在未压缩的真实Key-Value上计算。在100万上下文规模下，M3单token计算量仅为上一代模型的约1/20，推理效率显著提升。MiniMax在底层推理算子层面也进行了优化，相关性能较主流开源方案提升4倍以上。

Coding & Agent能力：SWE-Bench Pro超越GPT-5.5

M3在编码与智能体评测中达到行业顶尖水平：SWE-Bench Pro上超过GPT-5.5和Gemini 3.1 Pro，接近Opus 4.7。SVG-Bench上超越Opus 4.7。OmniDocBench上超越Gemini 3.1 Pro。BrowseComp智能体评测中以83.5分超越Opus 4.7的79.3分。Claw-Eval端到端评测中获得最高分。

M3在编程与Agent训练中创新引入交互式用户模拟器框架——通过模拟真实开发者在协作过程中的行为模式，让模型在训练阶段就接触到更接近生产环境的交互场景。写出的代码目标是直接可交付，而不是「能跑但需要人改」。

原生多模态：从Step 0开始混合训练

M3从Step 0开始进行多模态混合训练，文本、图片、视频等多模态数据在序列中交替自然排列。MiniMax重构了整套数据管线，将预训练数据规模扩充至100万亿token量级。模型不仅支持图像与视频理解，也具备桌面操作能力，可在复杂跨应用环境中执行Computer Use任务。

12小时无人干预：自主复现ICLR论文

MiniMax官方丢给M3一篇ICLR 2025杰出论文，让它独立复现。M3连续运行近12小时，全程自主产出18次commit与23张实验图表，成功跑通核心实验。另一个测试：给M3四个只完成预训练的Base模型，要求12小时内自主完成数据合成、训练、评测、迭代全流程，M3最终得分37.1，位列第三，仅次于Opus 4.7（42.4）和GPT-5.5（39.3）。

Token Plan订阅：Plus 49元/月起

MiniMax同步推出Token Plan订阅方案：Plus版每月49元提供6亿token，Max版每月119元提供18亿token，Ultra版每月469元提供55亿token。M3 API已上线，上下文≤512K价格7天限时五折。即将在HuggingFace和GitHub上开源。

A股上市同步推进

MiniMax已于5月29日向上海证监局提交上市辅导备案报告，中信证券担任辅导机构。港股上市以来股价最高触及1330港元，市值一度超2600亿港元。与智谱一同冲刺A股大模型第一股。

本站文章来源于网络摘取整理发布，如有侵权请联系 hy@uicn.cn 删除

MSA架构：百万token上下文的秘密

Coding & Agent能力：SWE-Bench Pro超越GPT-5.5

原生多模态：从Step 0开始混合训练

12小时无人干预：自主复现ICLR论文

Token Plan订阅：Plus 49元/月起

A股上市同步推进

相关文章

英伟达GTC 2026：Vera Rubin全面量产，RTX Spark正式进军PC芯片市场

NVIDIA发布Vera CPU：88核Olympus架构，OpenAI Anthropic成首批客户

NVIDIA发布Alpamayo 2 Super：320亿参数自动驾驶推理模型