MiniMax M3正式发布:百万级上下文窗口加原生多模态,BrowseComp评测超越Opus 4.7
来源:互联网稀宇科技(MiniMax)今日正式发布M3大模型,定位为首个同时具备前沿编码与智能体百万级上下文窗口原生多模态三项完整前沿能力的国产旗舰模型。M3基于自研的MSA(MiniMax Sparse Attention)稀疏注意力架构构建,最高支持100万token上下文,并保证至少512K token的可用长度。
MSA稀疏注意力架构,长上下文处理效率大幅提升
传统注意力机制在处理超长文本时面临算力和显存瓶颈,M3的MSA架构通过稀疏化策略绕开这一限制。在1M上下文场景下,MSA实现预填充加速9.7倍、解码加速15.6倍,使得超长文本的实际可用性大幅提高。M3同时提供标准版和高速版(M3-highspeed)两个API版本,输出结果完全一致,后者响应更快。
原生多模态,从第零步开始融合训练
与多数模型先训练文本后拼接视觉模块的路径不同,M3从预训练的第一步即开始多模态训练,重构了整套数据管线,预训练数据规模扩充至百T量级。文本与视觉语义空间的高度对齐使M3能直接理解学术论文中的图表与公式,并支持长视频理解。这种原生融合策略被认为是M3在多模态评测中表现突出的关键因素。
编码与智能体能力:BrowseComp超越Opus 4.7
在权威的BrowseComp智能体评测中,M3以83.5分的成绩超越Claude Opus 4.7(79.3分)。在模型训练自主任务评测PostTrainBench中,M3得分37.1,仅次于Opus 4.7(42.4分)和GPT-5.5(39.3分)。实测案例显示,M3能连续自主运行近12小时独立复现ICLR杰出论文,全程产出18次代码提交和23张实验图表。API定价为输入2.1元/百万token、输出8.4元/百万token,512K以内限时五折。M3即将在HuggingFace和GitHub开源,支持私有部署。