Minimax发布推理模型M1，这是它必须补上的一课|界面新闻 · 科技，Minimax推理模型M1发布，填补关键一课，界面科技报道

susihan 2025-06-19 2025热门 17 次浏览 0个评论

Minimax发布推理模型M1，填补了其产品线的关键一环。该模型标志着公司在人工智能领域的又一重要进展，为用户提供更高效、精准的推理服务。

界面新闻记者 | 伍洋宇

界面新闻编辑 | 文姝琪

</blockquote>

Minimax也开启了技术发布周，在前两天，该公司在模型和产品方面推出了重大更新，其中包括一款参数规模高达456B的推理模型M1，以及其核心产品——海螺AI。

M1是Minimax迟来的首款推理模型，不可避免地要和DeepSeek-R1进行比较，其两个显著亮点，一是强大的长文本处理能力，二是成本效益。

Minimax-M1支持高达100万token的上下文输入，是DeepSeek R1的8倍，在闭源模型中与谷歌Gemini 2.5 Pro相当，同时支持最长8万token的推理输出。

在实际应用中，如果用户提供一份100万token的阅读材料并提出需求，M1可以正常执行，但对于不支持如此长输入长度的模型，可能只能显示阅读了一部分内容并执行需求。

Minimax在其技术报告中指出，M1之所以能够实现长文本处理能力的突破，主要得益于Lightning Attention（闪电注意力）混合架构。

传统的Transformer架构在处理长文本时，其注意力机制下的计算量增长呈平方级，文本序列越长，计算量越剧增，这对性能和成本都是挑战。

Lightning Attention的做法是将全连接注意力拆分为两部分：一部分是针对局部上下文整合、采用传统注意力机制的“块内”attention，另一部分是针对全局摘要、采用线性注意力的“块间”attention，这一方案可以减少大量累积性的计算量，并提高处理速度。

在成本方面，其报告提到，在进行8万token的深度推理时，M1所需的算力为DeepSeek R1的约30%；生成10万token时，推理算力约为DeepSeek R1的25%，团队表示，M1模型的整个强化学习阶段仅使用了512块英伟达H800 GPU，耗时三周，成本为53.5万美元。

在这一点上，Minimax提出了CISPO（Clipped IS-weight Policy Optimization）算法，这是一种高效、稳定的强化学习策略，相比于PPO策略实行token级别的裁剪更新，它通过裁剪重要性采样权重提升强化学习效率，类似“序列级别”裁剪。

这使其更快实现收敛，并达成更少的训练时间和资源消耗，其报告中的实验数据显示，在AIME（AI-powered Moral Evaluator）等测试中，CISPO的收敛性均快于DAPO算法和GRPO算法。

M1的定价根据文本大小分为三个价格区间：0-32k Token，输入0.8元/百万Token，输出8元/百万Token；32k-128k Token，输入1.2元/百万Token，输出16元/百万Token；128k-1M Token，输入2.4元/百万Token，输出24元/百万Token。

这是一个相对较低的定价，但也意味着，随着文本输入与输出的增长，用户的token消耗费用也可能面临陡升。

至于产品，海螺AI加入了全新的Hailuo 02模型，视频可原生1080P，Minimax此次强调了它处理极端物理场景的能力，比如杂技，官方放出的演示视频也是一段杂技表演。

在AI视频竞技场的排行榜（Artificial Analysis Video Arena Leaderboard）中，Hailuo 02（0616）目前位居第二，仅次于字节旗下视频生成模型Seedance 1.0，超过了谷歌Veo 3 preview以及快手Kling 2.0。

在此之前，Minimax在众多大模型创业公司中以多模态能力著称，在DeepSeek-R1掀起巨浪近半年之后（期间Kimi、智谱、阶跃都有在这方面所更新和发布），它为何还要完善推理模型的能力版图？

一名AI大模型投资人对界面新闻记者表示，从时间线上来看，Minimax没有在OpenAI o1模型掀起范式变革后，在国内整体而言相对早的时间点发布一款推理模型，大概率是核心团队起初在决策判断上没有给到这个训练方向足够的重视?！?#36825;是团队必须补的一课?！?lt;/span>

另有一名接触过Minimax的投资人认为，Minimax现在向市场发布推理模型的重要意义，一是说明在技术上不掉队，二是用“唯一一个支持超长文本”的推理模型建立用户心智?！?#36825;对资本市场还是有影响的?！?#36825;名投资人表示。

除此以外，他认为此次M1发布即开源，如果模型的效果和口碑能够保持住，也可以让Minimax借机将以前相对短板的开发者社区运营起来，国内更受开发者认可的仍然是通义千问和DeepSeek。

在成本和长文本之外，回到基准测试等基本问题上，MiniMax-M1也有不俗表现，它在AIME 2024、LiveCodeBench、SWE-bench Verified上，略逊色于DeepSeek-R1-0528，不过在TAU-bench上有所赶超。

在体现长文本处理能力的MRCR（4-needle）上，它的确为开发者留下了深刻印象，大幅超越了一众开闭源模型。

<figcaption>图片：Minimax</figcaption>

</figure>

不过它究竟能够对开源社区产生多大影响还有待观察，在Github上，M1发布8小时后获得440星，截至目前得到了620星。

转载请注明来自济南盛世瑞华包装有限公司，本文标题：《Minimax发布推理模型M1，这是它必须补上的一课|界面新闻 · 科技，Minimax推理模型M1发布，填补关键一课，界面科技报道》

susihan 142篇文章站点微博

每一天，每一秒，你所做的决定都会改变你的人生！

天津海德一诺科技有限公司
传万家科技
济南盛世瑞华包装有限公司
深圳市鑫中幸房地产经纪有限公司
苏州亿昌钻井工程有限公司
香港城市大学深圳福田研究院
2025今晚必中必开一肖,新澳门天天免费精准大全2025,2025新奥正版资料大全,澳门资料大全,正版资料查询.
新澳门最精准正最精,澳门一肖一特免费开,新澳门精准免费大全,王中王72396.cσm.72326查询精选16码一,新澳门最精准正最精准查询.

发表评论取消回复

评论列表（暂无评论，17人围观）参与讨论

337p大尺度啪啪人体午夜,末发育娇小性色xxxxx视频,国产又黄又爽又刺激的免费网址 ,久久精品免费一区二区

厦门美创思会展服务有限公司管理员

最近发表

作者列表

赏析

Minimax发布推理模型M1，这是它必须补上的一课|界面新闻 · 科技，Minimax推理模型M1发布，填补关键一课，界面科技报道

发表评论取消回复

还没有评论，来说两句吧...

最近发表

标签列表

文章目录

337p大尺度啪啪人体午夜,末发育娇小性色xxxxx视频,国产又黄又爽又刺激的免费网址 ,久久精品免费一区二区

厦门美创思会展服务有限公司管理员

最近发表

作者列表

赏析

Minimax发布推理模型M1，这是它必须补上的一课|界面新闻 · 科技，Minimax推理模型M1发布，填补关键一课，界面科技报道

“科创板八条”周年，创新并购案例不断涌现，去年分红超386亿元|界面新闻，科创板周年庆，创新并购潮涌，分红总额突破386亿

油价上调加满一箱油多花10元,留心伪假宣传危害-精选解析、解释与落实与警惕虚假宣传-精选解析、解释与落实，油价上涨风险提示，警惕伪假宣传，加满一箱油多花10元！

信达地产，向专业投资者发行面值总额不超过30亿元公司债券获批|界面新闻 · 快讯，信达地产30亿元公司债券发行获批准，专业投资者投资热潮来袭

泰国总理通话录音引争议，第二大党退出执政联盟|界面新闻 · 快讯，泰国政治动荡升级，总理通话录音引发争议，第二大党退出执政联盟

日本5月出口同比下降1.7%实用释义、解释与落实与警惕虚假宣传-实用释义、解释与落实-留心欺诈性营销，日本5月出口降幅解析，警惕虚假宣传与欺诈营销风险

美法官判定特朗普削减国家卫生研究院拨款盈利，预计白宫将上诉|界面新闻 · 天下，美法官裁决特朗普削减国家卫生研究院拨款违宪，白宫或上诉

官方通报救护车跨省转运收费2.8万|界面新闻 · 快讯，跨省救护车转运费用高达2.8万，官方通报引关注

颜值高的人更容易吸引蚊子-详细解答、解释与落实与警惕虚假宣传-详细解答、解释与落实,拒绝虚假噱头风险，揭秘，颜值与蚊虫吸引力的真相与虚假宣传警示

天津海德一诺科技有限公司

传万家科技

济南盛世瑞华包装有限公司

深圳市鑫中幸房地产经纪有限公司

苏州亿昌钻井工程有限公司

香港城市大学深圳福田研究院

2025今晚必中必开一肖,新澳门天天免费精准大全2025,2025新奥正版资料大全,澳门资料大全,正版资料查询.

新澳门最精准正最精,澳门一肖一特免费开,新澳门精准免费大全,王中王72396.cσm.72326查询精选16码一,新澳门最精准正最精准查询.

发表评论取消回复

还没有评论，来说两句吧...

最近发表

标签列表

文章目录

Minimax发布推理模型M1，这是它必须补上的一课|界面新闻 · 科技，Minimax推理模型M1发布，填补关键一课，界面科技报道

“科创板八条”周年，创新并购案例不断涌现，去年分红超386亿元|界面新闻，科创板周年庆，创新并购潮涌，分红总额突破386亿

油价上调加满一箱油多花10元,留心伪假宣传危害-精选解析、解释与落实与警惕虚假宣传-精选解析、解释与落实，油价上涨风险提示，警惕伪假宣传，加满一箱油多花10元！

信达地产，向专业投资者发行面值总额不超过30亿元公司债券获批|界面新闻 · 快讯，信达地产30亿元公司债券发行获批准，专业投资者投资热潮来袭

泰国总理通话录音引争议，第二大党退出执政联盟|界面新闻 · 快讯，泰国政治动荡升级，总理通话录音引发争议，第二大党退出执政联盟

日本5月出口同比下降1.7%实用释义、解释与落实与警惕虚假宣传-实用释义、解释与落实-留心欺诈性营销，日本5月出口降幅解析，警惕虚假宣传与欺诈营销风险

美法官判定特朗普削减国家卫生研究院拨款盈利，预计白宫将上诉|界面新闻 · 天下，美法官裁决特朗普削减国家卫生研究院拨款违宪，白宫或上诉

官方通报救护车跨省转运收费2.8万|界面新闻 · 快讯，跨省救护车转运费用高达2.8万，官方通报引关注

颜值高的人更容易吸引蚊子-详细解答、解释与落实与警惕虚假宣传-详细解答、解释与落实,拒绝虚假噱头风险，揭秘，颜值与蚊虫吸引力的真相与虚假宣传警示

还没有评论，来说两句吧...