7 月 28 号晚上,智谱没发布任何预告地放了个大招,发布了他们新一代旗舰模型 GLM-4.5。
这个月 Kimi K2 、Qwen 3 接连发布,国产开源大模型硝烟未散,没想到智谱也加入了“战场”。亮眼的数据和原生融合能力,让 GLM-4.5 瞬间引爆关注。
这次发布的 GLM-4.5 系列包含GLM-4.5和轻量级 GLM-4.5-Air。
两款模型都采用了混合专家(MoE)架构,并拥有两种模式,思考模式 用于复杂推理和工具使用,非思考模式用于即时响应,可以依据个人需求进行切换选择。
两款大模型均全面开源(MIT协议),在 Hugging Face 与 ModelScope 平台就能找到。
HuggingFace:https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
ModelScope:https://modelscope.cn/collections/GLM-45-b8693e2a08984f
发布仅一天时间,GLM-4.5 就登顶 Hugging Face 全球第一。

从智谱提供的数据来看,GLM-4.5的标签已然分明:小而强,快而省。
GLM-4.5 是首个在单个模型中实现将推理、编码和智能体能力原生融合。综合能力达到开源 SOTA。在 LLM 评测中,GLM-4.5 取得了全球模型第三、国产模型第一,开源模型第一。数据成绩相当亮眼。
但 GLM-4.5 的参数量仅为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,参数优化显然做得很不错。


和前不久发布的 Kimi K2、Qwen3 相比,GLM-4.5 更强了,只从官方提供的数据来看,甚至超过了闭源的 Claude 4 Opus。

GLM-4.5 的 API 调用价格低至输入 0.8 元/百万 tokens,输出 2 元/百万 tokens。

GLM-4.5 模型生成速度更是“原地起飞”,官方数据中,高速版本最快能达到 100 token/秒。并且能够支持低延迟、高并发的实际部署需求。

这个性价比在目前的开源模型中堪称王者,属实算得上开发者福音了。
强大的性能最终要落地应用。GLM-4.5最大的杀手锏,正是其原生融合智能体能力,这意味着模型自己就是个“全能选手”,能同时处理复杂逻辑、编写代码并像智能体一样自主执行任务,为开发复杂 AI 应用提供了统一强大的“大脑”。
作为开发者,我最关心的还是编程能力。
GLM-4.5 在 Coding 的测评中,优于 Kimi K2 和 Qwen3-Coder。智谱用 52 个编程开发任务,直接对比 Claude Code + Claude-4-Sonnet、Kimi-K2、Qwen3-Coder 的表现。GLM-4.5 在几个开源大模型中,数据遥遥领先。
智谱不仅公开了性能对比图表,还完整公开了 52 道测试题目及 Agent 任务轨迹,供业界验证。
参考智谱目前公布的 API 调用价格,GLM-4.5 有望成为开发者寻求 AI 编程工具辅助时的高性价比开源替代方案。

智谱官方也为我们展示了几个 GLM-4.5 开发案例,如一句话生成一个真的能搜索的“谷歌搜索”:
Z.ai版本“谷歌搜索”:https://chat.z.ai/s/2bd291ba-fe6a-4026-a8f4-1efa498267b2

通过大模型强大的信息获取、内容理解、平台交互与自主执行能力,达到一句话生成网页的效果,让更多人体验开发的乐趣,或许正是大模型未来发展的方向之一。
我们最近在更新的 AI 零代码应用生成平台,也是用户输入需求描述,实时生成网页,并能够通过可视化界面,进行指定部分的修改。不过肯定比不过 GLM-4.5 这个完善(手动狗头)。
GLM-4.5 体验地址:https://chat.z.ai/
这一轮国产AI的“神仙打架”,GLM-4.5无疑放出了极具分量的“王炸”。在全球闭源模型纷纷涨价的背景下,GLM-4.5 代表的开源普惠路线显得格外珍贵。
而未来的大模型竞争,更加让人期待。
本文编辑:玉露