12333社保查询网

智谱GLM-5 VS Minimax M2.5

12333社保查询网www.sz12333.net.cn 2026-02-15来源：人力资源和社会保障局

　　1、模型版本与功能更新

　　·GLM5版本与功能升级：GLM5是智谱推出的大版本更新，定位为复杂工程和代理任务设计，对比上一代GLM 4.7有明显进步。官方表述显示，GLM5在前端、后端及长期任务中缩小了与Cloud OPIUS 4.5的差距，多项benchmark测试分数已接近该产品，部分方面甚至实现反超。目前该模型已上线智谱官网及Z点AI平台，API价格已公布，Coding Plan将于2026年2月16日正式上线新版本模型。伴随GLM5发布，智谱同步推出三项功能更新：a. 处于测试阶段的特工模式，可实现视角转换、自动分解协调任务并执行工作流，还具备数据分析、AI PPT生成能力；b. 数据洞察功能，可完成数据解析、绘图、端到端清洗与分析，支持导出Excel、CSV、PNG格式文件；c. 写作功能升级，支持多种写入模式，可直接导出PDF和Word格式文件。

　　·M2.5版本定位与状态：M2.5是Minimax推出的小版本更新，此次更新较为突然，截至目前API端仍未开放M2.5的使用选项，相关价格也尚未公布。该模型被定位为全球首个为Agent场景原生设计的生产级模型，与GLM5核心设计方向一致，均以复杂Agent任务为目标场景。

　　2、模型价格体系对比

　　·GLM5及旧版本价格调整：GLM系列模型价格上调，GLM5的Output价格为3.2美元/百万Tokens。原GLM4.6、4.7的Output价格约1.5美元/百万Tokens，目前GLM4.7的Output价格已上调至2.2美元/百万Tokens。该系列针对国内外市场实施分层涨价：API价格方面，国内提价33%~100%，海外提价67%~100%；Coding Plan订阅价格同步调整，海外Let和Max版本分别提价60%和30%，国内Light和Max版本分别提价23%和18%。

　　·Minimax价格与套餐对比：Minimax相关模型及套餐价格情况如下：M2、M2.1的API价格约1美元/百万Tokens，M2.5的API价格尚未公布。对比双方国内Coding Plan订阅套餐：GLM国内最小订阅套餐为49元/月，标注为Cloud Pro套餐的三倍用量，但未明确具体Tokens和Prompts数量；Minimax国内最小订阅套餐为29元/月，采用Props计价，用量为每5小时40 Props，该计价方式对Tokens使用量较大的专业用户更具性价比。

　　3、代码任务能力多维度评测

　　·GLM5代码任务表现：对GLM5开展四项代码任务测试，具体表现如下：在赛博新年版羊了个羊网页游戏任务中，可一次性准确复现游戏规则并完成关卡，对比国内多数模型易出现规则错误的表现优势突出；在交互式粒子实验任务中，实现效果与ChatGPT的Codex非常接近，优于国内其他多数模型；在3D SVG风扇生成任务中，仅能生成静态图片样式，无法实现转动效果；在打卡应用生成任务中，可完整实现三个页面的全部功能，时间分布轴的可视化效果达标。

　　·跨模型横向对比分析：将GLM5与国内外主流模型进行横向对比，差异表现如下：国内模型中，K2.5是GLM5推出前代码任务表现最优的模型，可复刻羊了个羊游戏规则，粒子实验能实现气体效果，3D SVG风扇仅能生成静态图，打卡应用可完整生成；海外模型中，Claude Opus 4.7、Gemini可实现气体和液体的粒子实验效果，Opus 4.5无法完成羊了个羊任务，Claude Opus 4.7及Cloud的OPS 4.5可完成该游戏任务；国内除K2.5外的其他模型在粒子实验等任务中表现较差。

　　·M2.5代码任务表现：对M2.5的四项代码任务表现进行测试，结果如下：在羊了个羊网页游戏任务中，生成的游戏可直接通过链接打开，规则与原版略有差异，但具备消除后下一层出现的效果，整体接近原版；在交互式粒子实验任务中，采用粒子模拟风速的方式，仅实现流体动力模拟的雏形，具备一定物理效果；在3D SVG风扇生成任务中，可实现转动效果，但表现生硬怪异；在打卡应用生成任务中，界面简洁，所有功能均可正常使用。整体来看，M2.5在功能完成及应用创建方面与GLM5、K2.5差距不大，仅在物理模拟等多模态任务中存在一定差异。

　　4、Agent办公任务多场景评测

　　·PPT制作任务对比：此前曾让Codex和Opus 4.7通过网页链接提取信息制作PPT，本次以agent模式公平对比GLM5与M2.5的网页信息提取类PPT制作效果：a. GLM5：可生成HTML格式PPT并导出PDF/PPTX，国内平台支持生成营收增长趋势图，还可进行颜色、风格定制，Z点AI平台同案例效果更优；b. M2.5：生成的PPT内容简洁，但存在排版瑕疵，图片颜色设置不合理，整体表现弱于GLM5。

　　·股价分析辩论任务对比：设置多视角股价分析辩论任务，要求AI以看涨、看跌、中性三个角度分析谷歌股价并辩论，最终给出共识：a. M2.5：无Agent团队功能，依靠自身思考完成任务，先进行两三分钟思考及中英文网页搜索，生成英文分析内容，将股价分析划分为七部分，最终形成共识并附上股价预测及关键指标附录；b. GLM5：调用Finance和Web Search技能，分六个步骤完成任务，生成11页中文PDF分析报告，数据来源涵盖雅虎财经、彭博及Finance API，开篇展示关键财务指标，但辩论环节内容相对简略。

　　·复杂网页开发任务对比：以生成红楼梦十二钗手册网页为复杂网页开发任务，两款模型表现如下：a. GLM5：虽调用多种技能，但因上下文限制未完成网页生成，重新生成需从头运行流程；b. M2.5：完成网页开发，格式和文字均无问题，但存在图片匹配错误的瑕疵，整体完成度优于GLM5。综合来看，两款模型当前均已具备较好的复杂网页开发能力。

　　5、模型表现总结与收尾

　　·模型整体表现总结与展望：GLM LLM 5大版本更新后表现出色，在代码任务、Agent任务上完成情况优异，可追上GPT-4.5的效果，属国内头部AI模型。当前国内各AI模型能力差距正持续缩小，期待Minimax后续大版本更新的表现。

　　·会议收尾与致谢：本次评测结束，感谢参会人员；同时推广进门APP，用户可通过该APP获取优质复盘资料、专业AI工具和投研内容，还可领取会员体验。

本文标题：智谱GLM-5 VS Minimax M2.5本文网址：https://www.sz12333.net.cn/zhzx/kexue/75082.html　编辑：12333社保查询网

12333社保查询网

智谱GLM-5 VS Minimax M2.5

相关信息

推荐