MiniMax M2 系列用户反馈分析报告 v4

432

有效帖子数

360

独立用户

104

性能

Agent能力

性价比

速度快

核心概览

当前纳入有效样本 432 条、独立用户 360。
语言重算后：英文 333、中文 99、日文 0。
叙事重点总量：性能 104、性价比 94、速度快 7、Agent能力 77、其他重点 150。
最核心使用场景：软件开发/编码 101、Agent/OpenClaw/Hermes Agent 122、价格/成本优化 114。
Agent 相关样本中，明确作为辅助/执行层的有 34 条，明确作为主模型的只有 8 条。

爬虫检查结论

Current production crawler file: `crawl_x_minimax_m2.py`
core15 round2 raw rows: 304
followup trio raw rows: 153
merged unique raw rows: 456
relevant stage1 rows: 432
Uses logged-in X.com session via Chrome CDP and actual page scrolling, not static search HTML.
Query set is broad enough: brand/version + pricing/API + competitor mixes + Chinese queries + follow-up GLM/GPT/Kimi.
Results are already merged across multiple crawl rounds.
Relevance filtering removed obvious false positives.
It cannot prove “全部爬完” in a strict sense; X search is dynamic and ranking/visibility can change over time.
Earlier versions overwrote `minimax_m2_raw_posts.json`; I patched the crawler to support append/merge and per-query dumps for future reruns.
Earlier extractor could miss truncated posts; I patched the crawler to click `显示更多`/`Show more` before extraction.
The current merged dataset was produced before that patch, so the existing raw set is strong but not guaranteed maximally complete.
Some low-yield keywords suggest search-term limitations more than crawler failure (e.g. overly specific benchmark/review wording on X).
The crawler is usable and materially complete enough for analysis, but not “provably exhaustive”.
For a stricter final crawl, rerun the patched crawler with `--append-existing`, then re-merge/dedupe.

投资分析：MiniMax M2 系列的宣传重点与战略重心（语义重标版）

核心判断：MiniMax M2 系列当前在市场中的真实定位，更接近“工程型执行模型”而非“绝对性能型主脑模型”。从 432 条有效样本的语义重标结果看，叙事分布为：性能 104、性价比 94、速度快 7、Agent能力 77、其他重点 150。由此可见，市场对其认知并非围绕“全面性能领先”展开，而是围绕“足够强、足够便宜、适合接入工作流”展开。
正向评价的核心来源：样本中被明确表扬最多的维度，不是泛化的“模型最强”，而是更具体的工程价值：性价比/成本低、性能达到可用阈值、Agent 执行力/工具调用、API/接入体验、代码能力。换言之，MiniMax 获得认可的主要逻辑是“单位成本下的有效能力”，而非在高难度复杂任务上对 Claude / Opus / GPT 形成全面替代。
国内用户画像与投资含义：中文区 99 条样本中，“性能强/能力强”的明确正向表述只有 5 次，但“性价比/成本低”11 次、“API/接入体验好”8 次，同时“性能不如顶级模型”负面表述达到 11 次。这说明国内用户对 MiniMax 的定价与可用性有认可，但对其裸模型能力更谨慎，且明显更关注它在 prompt、harness、编排框架下的实际可用性。这一特征意味着，MiniMax 在国内更适合被视为“体系化使用后的高性价比组件”，而不是凭借裸性能建立品牌溢价的产品。
海外用户画像与投资含义：英语区 333 条样本中，正向评价更集中且更友好，高频标签依次为：性价比/成本低（73）、性能强/能力强（38）、Agent执行力/工具调用（22）、API/接入体验好（21）、代码能力（13）。这表明海外用户对 MiniMax 的接受度更高，但认可仍主要来自其工程价值与经济性，而非单纯认为其在核心能力上压过顶级闭源模型。对投资判断而言，这意味着 MiniMax 在海外更有机会走“开发者基础设施层”和“低成本执行层”路线，而不是直接与顶级旗舰模型争夺心智高地。
Agent 场景的商业含义最强：当前样本中，Agent/OpenClaw/Hermes Agent 场景达到 122 条；进一步做角色语义判断后，明确作为辅助/执行层的有 34 条，明确作为主模型（策划+执行）的只有 8 条。这个比例表明，MiniMax 在实际 Agent 体系里的主流角色，是承担执行、工具调用、批量处理与工作流落地的“下层模型”，而不是最高复杂度任务中的总控模型。其最强竞争力来自被更强模型或更优框架调度后的效率优势。
使用场景结构进一步强化上述判断：重构后的高频使用场景为：软件开发/编码 101、Agent/OpenClaw/Hermes Agent 122、日常交流聊天 8、文本撰写 4、翻译 3。也就是说，MiniMax 的主战场并不是消费级聊天、通用写作或翻译，而是开发者与 Agent 工作流。由此推断，其商业化潜力更适合放在开发工具链、API 消费、agent infra、路由层与高频执行层市场，而不是 C 端陪伴式入口。
综合投研结论：MiniMax M2 系列的战略重心，正在从“能力展示与 benchmark 证明”转向“工作流可接入性 + 成本优势 + Agent 执行层价值”的组合叙事。若后续官方继续强化 benchmark、API、工作流、Agent 生态与价格优势，其市场位置会更接近“面向开发者和 Agent 体系的高性价比执行模型供应商”。这一定位在商业上未必意味着最高溢价，但意味着更清晰的落地需求、更明确的替代路径，以及在多模型协同市场中的长期存在价值。

五类互斥叙事重点定义（MiniMax 语义版）

性能：编码、推理、长上下文、准确率、benchmark、模型能力。
性价比：量大管饱、便宜、token 成本低、订阅/API价值高。
速度快：输出速度、响应速度、执行速度、延迟低。
Agent能力：工具调用、Agent 编排、多文件编辑、多轮执行、自主任务完成能力。
其他重点：发布、榜单、融资、合作、生态、市场传播、泛测评。

重新梳理后的主要使用场景

其他/未明确124

Agent/OpenClaw/Hermes Agent122

价格/成本优化114

软件开发/编码101

模型测评/基准测试71

日常交流聊天8

文本撰写4

翻译3

中外用户评价差异（语义重标版）

区域	样本量	高频场景	高频被夸点	高频被骂点	解读
中文区	99	其他/未明确(36) / Agent/OpenClaw/Hermes Agent(27) / 软件开发/编码(19) / 价格/成本优化(16) / 模型测评/基准测试(15)	性价比/成本低(11) / API/接入体验好(8) / 性能强/能力强(5) / Agent执行力/工具调用(3) / 推理能力(1) / 速度快/延迟低(1)	性能不如顶级模型(11) / 幻觉/错误率(8) / API/接入问题(6) / 服务稳定性/负载问题(3) / 需要更好框架/提示词(3) / 延迟/速度慢(2)	更强调编排、国产模型横比和工作流适配，对 MiniMax 裸性能夸赞更谨慎。
英语区	333	价格/成本优化(98) / Agent/OpenClaw/Hermes Agent(95) / 其他/未明确(88) / 软件开发/编码(82) / 模型测评/基准测试(56)	性价比/成本低(73) / 性能强/能力强(38) / Agent执行力/工具调用(22) / API/接入体验好(21) / 代码能力(13) / 配合优秀框架更好用(8) / 速度快/延迟低(8)	性能不如顶级模型(35) / 代码能力不足(7) / 需要更好框架/提示词(6) / API/接入问题(6) / 延迟/速度慢(3) / 服务稳定性/负载问题(3)	整体更友好，但买账点主要是成本、速度、Agent/开发工作流可用性，而不是全面压过顶级模型。

Agent 场景中的角色定位

Agent场景未明确76

辅助/执行层（依托框架或更强模型）34

主模型（策划+执行）8

结论：MiniMax 在 Agent 场景里更多被当作辅助/执行层，而不是绝对主脑。清晰证据显示，很多用法是更强模型/更优 harness 做规划与编排，MiniMax 负责便宜高频执行、工具调用和工作流落地。

被夸指标

性价比/成本低84

性能强/能力强43

API/接入体验好29

Agent执行力/工具调用25

代码能力13

配合优秀框架更好用9

速度快/延迟低9

推理能力6

长上下文/多语言5

这里的“被夸”按句子真实含义重标，不再把“便宜”误判成“性能强”，也不把“在好框架下可用”误判成“裸能力领先”。

被骂指标

性能不如顶级模型46

API/接入问题12

需要更好框架/提示词9

代码能力不足9

幻觉/错误率9

服务稳定性/负载问题6

延迟/速度慢5

价格偏高4

推理不稳定1

这里的“被骂”也按句子真实含义重标，例如样例里 MiniMax 便宜不再会被误判成“价格偏高”。

竞品提及频次

glm180

kimi151

qwen109

claude95

gpt77

gemini66

deepseek64

opus42

codex36

grok25

anthropic20

openai20

sonnet12

各月总体叙事重点

月份	普通用户	AI测评者	MiniMax传播/KOL	官方	当月高频叙事
2025-12	1	0	0	0	性价比
2026-01	3	0	0	0	其他重点
2026-02	6	1	2	0	性能
2026-03	69	17	15	0	Agent能力
2026-04	261	21	35	1	性能

普通用户（含开发者）

2025-12：重点=性价比；分类计数=性价比:1
2026-01：重点=其他重点；分类计数=其他重点:3
2026-02：重点=性能；分类计数=性能:2 / 性价比:2 / Agent能力:1 / 其他重点:1
2026-03：重点=性能；分类计数=其他重点:29 / 性能:15 / 性价比:12 / Agent能力:10 / 速度快:3
2026-04：重点=性能；分类计数=其他重点:100 / 性能:58 / 性价比:53 / Agent能力:47 / 速度快:3

月份	叙事重点	示例账号	日期	链接	摘要
2025-12	性价比	@shamanic_arts	2025-12-31	原帖链接	GLM 首月之后是 6 美元。不过我同意，相比 zai，minimax 的定价确实显得偏贵。
2026-01	其他重点	@mqstro	2026-01-05	原帖链接	AI 市场已经接近狂热：像 MiniMax 这样的中国公司在香港 IPO 定价时拿到高估值溢价，并宣称自己可比 OpenAI。与此同时，债务资金也在纯靠炒作地涌入。这种狂热就是经典繁荣陷阱的信号——估值被拉得过高、杠杆押的是预测而不是现金流。投资人追逐的是叙事，
2026-02	性能	@sharaff	2026-02-25	原帖链接	Minimax 的定价几乎无可匹敌。但在推理和深度思考上还是差一些。那种 chain-of-thought 式的推理能力还不到位。
2026-03	性能	@0xSero	2026-03-29	原帖链接	—— 256 GB —— #1 MiniMax-M2.5 (M2.7) - 6bit MLX #2 Qwen3.5-262B-REAP (4-6 bits) #3 Nemotron-122B (8-9 bits) #4 GLM-5-358B (4bit) —— 512 GB —…
2026-04	性能	@lero003	2026-04-12	原帖链接	一年前我也做过类似的事，这个很有参考价值！不过这么一看，开放权重的 GLM / minimax / qwen(27b) 也挺能打，真的很厉害。最新模型居然已经能做到这种程度了……如果不付费，现在 AI 的网页搭建能力已经越来越难判断了。我已经把以下模型加进“同 promp…

AI测评者

2025-12：重点=无有效样本；分类计数=无
2026-01：重点=无有效样本；分类计数=无
2026-02：重点=性能；分类计数=性能:1
2026-03：重点=性价比；分类计数=性价比:8 / 其他重点:4 / Agent能力:3 / 性能:2
2026-04：重点=性能；分类计数=性能:17 / Agent能力:3 / 其他重点:1

月份	叙事重点	示例账号	日期	链接	摘要
2025-12	无有效样本	该类用户当月无有效示例
2026-01	无有效样本	该类用户当月无有效示例
2026-02	性能	@itsrobert	2026-02-15	原帖链接	Deepseek 很强，所以基于它之前的发布，我会多给它一点信任。不过 kimi 和 minimax 把 benchmark 刷得很高，也让我对很多中国 AI 公司更有信心。实际在封闭 benchmark 上表现如何，还得再看。
2026-03	性价比	@iamsupersocks	2026-03-20	原帖链接	开放权重的黄金时代正在收口，但不是大家以为的那种方式。 MiniMax M2.7 刚发布，性能达到 GLM-5 水平，成本只要三分之一。但真正的重点不是 benchmark。而是这是 MiniMax 第一个发布时不公开权重的旗舰模型。不能下载。 Introducing Mi…
2026-04	性能	@AstroHanRay	2026-04-09	原帖链接	以前那种“中国 = 开放权重，美国 = 前沿闭源模型”的叙事正在迅速瓦解。 Qwen3.6 Plus 是专有、多模态模型，表现已经和 MiniMax-M2.7 在同一档，只略逊于 GLM-5.1。benchmark 差距在缩小，市场也越来越拥挤。阿里巴巴新发布的 Qwen3.…

MiniMax传播/KOL

2025-12：重点=无有效样本；分类计数=无
2026-01：重点=无有效样本；分类计数=无
2026-02：重点=性价比；分类计数=其他重点:1 / 性价比:1
2026-03：重点=Agent能力；分类计数=Agent能力:8 / 其他重点:4 / 性能:2 / 性价比:1
2026-04：重点=性价比；分类计数=性价比:16 / 其他重点:7 / 性能:6 / Agent能力:5 / 速度快:1

月份	叙事重点	示例账号	日期	链接	摘要
2025-12	无有效样本	该类用户当月无有效示例
2026-01	无有效样本	该类用户当月无有效示例
2026-02	性价比	@ai_fieldguide	2026-02-15	原帖链接	MiniMax 的定价压力，迫使西方提供商必须通过性能差异、支持质量、合规保障以及集成能力来证明高溢价的合理性，而不能只靠品牌认知。
2026-03	Agent能力	@AIsaOneHQ	2026-03-23	原帖链接	OpenClaw 刚刚又推送了一次很硬核的更新 - ClawHub plugin marketplace - 更多模型（MiniMax、GPT 等） - 内置搜索（Exa、Tavily、Firecrawl） - Sandbox 和执行环境这意味着 agents 现在可以调用更…
2026-04	性价比	@gengdaJ	2026-04-13	原帖链接	claude code 本身是免费的啊！不需要买官方 claude，用国产的 minimax、kimi 和 GLM 都可以！不用科学上网也能用，看我这篇教程几分钟就能配好。如果你还不会配置、不会使用 Claude Code，作为小白就看看我这期视频！不教你复杂的官方配置，就…

官方

2025-12：重点=无有效样本；分类计数=无
2026-01：重点=无有效样本；分类计数=无
2026-02：重点=无有效样本；分类计数=无
2026-03：重点=无有效样本；分类计数=无
2026-04：重点=性能；分类计数=性能:1

月份	叙事重点	示例账号	日期	链接	摘要
2025-12	无有效样本	该类用户当月无有效示例
2026-01	无有效样本	该类用户当月无有效示例
2026-02	无有效样本	该类用户当月无有效示例
2026-03	无有效样本	该类用户当月无有效示例
2026-04	性能	@MiniMax_AI	2026-04-12	原帖链接	我们很高兴宣布，MiniMax M2.7 现已正式开源。 SWE-Pro（56.22%）和 Terminal Bench 2（57.0%）都达到了 SOTA 表现。现在你已经可以在 Hugging Face 上找到它。请尽情使用！ huggingface： https:// …