首页
学习
活动
专区
圈层
工具
发布

为国争光!智谱GLM-4.7横扫全球开源模型,超越GPT5.2

欢迎来到北茗的AI茶馆

智谱又为国争光了!

智谱正准备在港交所上市,即将成为全球大模型第一股。

同时,发布了「GLM-4.7」模型。

GLM-4.7最惊艳的是编程能力,在国产模型中排名第一。

放眼全球,也是横扫所有开源模型,甚至评分超过了GPT-5.2。

就是这么强。

不光是编程能力,工具调用和复杂推理能力也都有所提升。这让GLM-4.7在编程场景和智能体场景中,都有了更好的表现。

不聊那些复杂的参数,直接上case!

先看一下官方提供的case。

编程·复杂交互:

审美·PPT·海报:

前端优化·多样化风格:

不看广告,看疗效。

下面亲手测一下GLM-4.7的编程能力,并与Gemini 3.0 Pro进行对比。

http://chat.z.ai

先来试试游戏效果,生成类似马里奥的闯关小游戏。

GLM-4.7:

Gemini 3.0 Pro:

很明显,GLM的画面、操纵感都更好。

Gemini的就是一个简单Demo,而且跳跃高度设计得并不合理。

再生成一个3D赛车小游戏。

GLM-4.7:

Gemini 3.0 Pro:

这个case有点难度。

GLM调试了好几轮才生成上面的效果,方向操纵总是有问题,而且很卡顿。

Gemini的操纵感更丝滑,bug也更少。

测了几个3D的游戏和应用,两个模型都还有很大进步空间,但Gemini相对更强些。

再测测网页编程能力,生成一个Python学习网站。

GLM-4.7:

Gemini 3.0 Pro:

这两个UI真的太像了,背景用的同一个动态效果。

整体上GLM的效果更好,网页下端竟然还有一个排序算法的动态演示,有点惊喜。

生成一个海报创作灵感网站。

GLM-4.7:

Gemini 3.0 Pro:

两个效果都很在线,我个人更喜欢Gemini的,布局更舒适。

几个case测下来,GLM-4.7能和Gemini 3.0 Pro打个平手。

国产模型这么快就追上了Google和OpenAI的步伐,智谱厉害了。

GLM-4.7在不同场景中,会选择不同的思考模式。

交错式思考

GLM-4.7默认是交错式思考。

意思是,模型在工具调用之间和获取到工具结果后,再进行推理。

在下一步操作前,解释每个工具调用的结果,将这些解释与推理步骤串联,再结合中间结果来做出推理。

这让GLM能够支持更加复杂的推理。

保留式思考

这是GLM-4.7引入的新功能,用于编程场景。

意思是,模型保留之前回合的推理内容。

这样可以提高缓存利用率,节省token。还能保持推理的连续性和对话的完整性。

回合式思考

意思是,在每个回合都能独立选择是否开启思考模式。

这样可以降低推理开销和成本,让推理更加灵活。

最后,祝智谱顺利成为全球大模型第一股,也希望越来越多的国产模型登顶各大榜单!

GLM-4.7体验

 http://chat.z.ai

HuggingFace

 http://huggingface.co/zai-org/GLM-4.7

技术博客

 http://z.ai/blog/glm-4.7

如果你有任何看法,欢迎在评论区一起讨论

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O-6b7zQQr5aoPycljVyft32Q0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券