10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战出品:《态度》专栏撰稿人 |远宁主编|丁广生 从2月11日深夜到2月12日凌晨,短短几个小时内,国内三大著名造型公司几乎同时完成了一系列重大更新。智浦正式推出GLM-5,MiniMax M2.5作为试用产品悄然推出,DeepSeek也开始了新一轮的功能更新。智浦GLM-5:从“写代码”到“搞工程” 2月12日,智浦正式宣布发布并开源全新GLM-5模型。与此同时,此前在OpenRouter上流行的匿名Pony Alpha模型被确认为GLM-5。在匿名测试阶段,世界各地的开发人员已经将该模型用作真正的生产工具。有些人用它来创建水平益智游戏,而另一些人则用它来构建代理的交互式世界。其他人直接开发完整的申请表,例如印刷版“抖音”,以此为基础。该模型已在未经品牌批准的情况下完成了市场的实际验证,因此代表了功能水平的变化。智普对GLM-5的定位非常明确。这不是聊天模型;它是代理工程的基本模型。过去两年,对大型模型的主流解释是“写代码”和“写前端”。但现在行业共识正在发生变化。该模型需要完整的工程和复杂的任务,从“振动编码”到“代理工程”。 GLM-5是现阶段的代表产品。与前几代相比,GLM-5 不再满足于生成漂亮的演示和 Python 脚本,而是旨在始终如一地交付结果。生产水平状态。从实际编程场景的使用体验来看,GLM-5被认为接近当前业界上限Claude Opus 4.5。就基本功能而言,GLM-5 完全不完善维。 ● 参数范围:从上一代355B(32B激活)扩展到744B(40B激活)。 ● 数据大小:预训练数据从23T增加到28.5T。 ● 架构创新:首次集成DeepSeek分散辅助机制。该技术显着降低了模型实现的成本,提高了token生成的效率,同时保持了长文本的无损效果。 ● 异步强化学习:新的“Slime”框架的创建是为了让模型在长时间的交互过程中继续学习,而不必“聊几句就忘记了”。在Arti Analysis排行榜上全球最权威的来源中,GLM-5排名全球第四,开源第一。在对工程师来说最重要的编程功能方面,GLM-5 与 Claude Opus 4.5 相匹配。在SWE Bench Validation(软件工程基准测试)中,GLM-5取得了77.8的高分。 Terminal Bench 2.0 达到 56.2。时间这两项成绩直接超越了谷歌的Gemini 3 Pro,以及开源的SOTA(State Of The Art)模型。在Claude Code在Zhipu内的评估集中,GLM-5在后端重构和深度调试等“硬”任务上比GLM-4.7平均提高了20%以上。 GLM-5 在代理功能方面实现了开源 SOTA,并在多个评估基准的开源中排名第一。更有趣的是自动售货机2的测试结果。该测试要求e模型运营模拟自动售货机业务一年。 GLM-5 账户的最终余额为 4,432 美元。这意味着您不仅可以编写代码,还可以了解资源管理和长期规划。这种“运算能力”是AGI的关键。这是重要的一步。当晚:MiniMax 和 DeepSeek Shippu 正式发布,同时为另外两个巨头进行设计。昨晚,细心的网友注意到MiniMax Agent产品的底层型号选项中悄然出现了一个新名称:MiniMax M2.5。该公司尚未发布正式公告,但这显然是产品端的“实弹演习”。早期测试用户的反馈称“M2.5代理具有爆炸性的能力”,“编程和工具调用功能强大且经济”。直到唐,据我们所知,MiniMax M2.5是世界上第一个为智能体场景原生设计的生产级模型。其编程和代理(coding and Agent)性能可与全球最好的模型相媲美,直接与Claude Opus 4.6进行对比,支持PC、应用程序和跨端应用程序的全栈编程开发。特别是,SOTA 在关键的 Office 生产力场景中占有一席之地,例如高级 Excel 处理、深入研究和 PPT。同时,M2.5模型的激活参数仅为10B,在内存u上具有明显优势Sage和Inference能效,支持100 TPS超高性能。此外,DeepSeek也已经秘密更新,尽管大家还在想DeepSeek V4什么时候到来。昨晚我们与 DeepSeek 坐下来了解到底发生了什么。当我关闭深度思考和网络搜索后查阅模型的信息时,我注意到上下文长度增加到了 100 万个 token(之前为 128,000 个),并且知识库截止日期已更新到 2025 年 5 月。2026 年注定不会平静。通过GLM-5,智普展示了中国模型可以与世界最强的复杂工程能力竞争。 MiniM AX在产品方面正在迅速行动,以俘获用户的心。我正在实现它。但大家还在等待 DeepSeek 行动。对于我们这些正在乘风破浪的人来说,唯一的选择就是跟上。毕竟,今晚的 10 倍之后,您可能就只剩下几秒钟的时间了。

推荐文章

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注