这几天的大模型圈，真的有点“卷”过头了

原创

BugShare

发布于 2026-02-18 20:11:56

1100

如果你这两天刷科技圈信息，可能会有一种感觉：

刚看完一个模型更新，还没消化完，下一个又来了。

除夕夜，本该是安安静静吃年夜饭的时间，大模型厂商却像打了鸡血一样——

一个接一个更新，毫不客气。

“现在不是模型不够用，是我根本不知道该选哪个。”

一、先说个容易被忽略，但很关键的变化

最近 DeepSeek 的 APP 更新了版本，表面看是一次“小升级”，但其实很不简单。

两个变化，值得单独拎出来说：

第一，上下文直接拉到 100 万 Token。

这是什么概念？

以前你跟 AI 聊天，它像个短期记忆不好的人，聊多了就“忘前文”；

现在相当于你一次性把完整代码库、项目文档、甚至一本书丢给它，它还能从头看到尾。

这不是“更大数字”的问题，而是使用方式彻底变了。

第二，知识库时间线更新到 2025 年 5 月。

这几乎可以确定一件事：

背后已经不是老模型微调，而是新一代模型在路上了。

之前传闻说春节前后会有动作，现在基本算是实锤预热。

二、除夕夜最狠的一刀，来自阿里

如果说 DeepSeek 是“悄悄换了发动机”，

那阿里这波就是直接“换了车”。

除夕当天，阿里发布了新一代模型：千问 Qwen3.5-Plus。

很多人第一反应是：

“又升级？我已经麻了。”

但这次不太一样。

几个点你只要记住一句话就够：

用不到一半的参数量，干翻了自家万亿级模型。

更夸张的是：

原生多模态（文字、图片、理解一起上）
推理吞吐最高提升 19 倍
API 价格低到离谱：百万 Token 只要几毛钱

说实话，这已经不是“技术炫技”，而是赤裸裸的工程和成本碾压。

现在很多团队，包括我们身边的一些真实项目，已经在用

阿里云 百炼的 API 把它接进生产系统。

不是因为情怀，是因为真省钱、真能跑。

三、国外这边也没闲着，Claude 继续加码

你以为国内卷完就结束了？

紧接着，Anthropic 发布了 Claude Sonnet 4.6。

这次更新没有新概念，也没有夸张营销，但很“工程师向”：

同样支持 100 万 Token
推理更稳，不爱胡编，也不瞎设计
电脑操作能力明显提升，复杂表格、多页面任务能一口气做完
关键是：价格没涨

现在你打开 claude.ai，免费用户用的就是新版本，

Cursor、GitHub、Replit 这些工具也已经全部接入。

一句话总结：

它不是最便宜的，但是最“省心”的那一档。

四、所以问题来了：普通人到底该怎么选？

你预算充足、追求最稳的编程和推理体验 👉 Claude Opus / Sonnet 系列
你想让 AI 自己跑任务、做 Agent、长流程执行 👉 智谱 GLM-5 这种偏工程化的模型更合适
你想省钱，但又不想牺牲能力，尤其是多模态 👉 千问 Qwen3.5-Plus 是目前性价比最狠的选项之一

现在的现实是：

已经不存在“唯一最强模型”了。

谁更适合你的场景，谁就是最好的。

五、最后说句掏心窝子的

这一波更新，看着像“模型内卷”，

但对用户来说，其实是红利期。

上下文越来越大
成本越来越低
能力越来越接近真实“干活助手”

真正难的，反而不是模型不够强，

而是——

你有没有想清楚，要用它来干什么。

模型会继续卷，

但会用的人，已经开始悄悄拉开差距了。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

大模型部署

人工智能

AI 互动体验展

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

登录后参与评论

0 条评论

热度