
如果你这两天刷科技圈信息,可能会有一种感觉:
刚看完一个模型更新,还没消化完,下一个又来了。
除夕夜,本该是安安静静吃年夜饭的时间,大模型厂商却像打了鸡血一样——
一个接一个更新,毫不客气。
“现在不是模型不够用,是我根本不知道该选哪个。”

最近 DeepSeek 的 APP 更新了版本,表面看是一次“小升级”,但其实很不简单。
两个变化,值得单独拎出来说:
第一,上下文直接拉到 100 万 Token。
这是什么概念?
以前你跟 AI 聊天,它像个短期记忆不好的人,聊多了就“忘前文”;
现在相当于你一次性把完整代码库、项目文档、甚至一本书丢给它,它还能从头看到尾。
这不是“更大数字”的问题,而是使用方式彻底变了。
第二,知识库时间线更新到 2025 年 5 月。
这几乎可以确定一件事:
背后已经不是老模型微调,而是新一代模型在路上了。
之前传闻说春节前后会有动作,现在基本算是实锤预热。
如果说 DeepSeek 是“悄悄换了发动机”,
那阿里这波就是直接“换了车”。
除夕当天,阿里发布了新一代模型:千问 Qwen3.5-Plus。
很多人第一反应是:
“又升级?我已经麻了。”
但这次不太一样。
几个点你只要记住一句话就够:
用不到一半的参数量,干翻了自家万亿级模型。
更夸张的是:
说实话,这已经不是“技术炫技”,而是赤裸裸的工程和成本碾压。
现在很多团队,包括我们身边的一些真实项目,已经在用
阿里云 百炼的 API 把它接进生产系统。
不是因为情怀,是因为真省钱、真能跑。
你以为国内卷完就结束了?
紧接着,Anthropic 发布了 Claude Sonnet 4.6。
这次更新没有新概念,也没有夸张营销,但很“工程师向”:
现在你打开 claude.ai,免费用户用的就是新版本,
Cursor、GitHub、Replit 这些工具也已经全部接入。
一句话总结:
它不是最便宜的,但是最“省心”的那一档。
现在的现实是:
已经不存在“唯一最强模型”了。
谁更适合你的场景,谁就是最好的。
这一波更新,看着像“模型内卷”,
但对用户来说,其实是红利期。
真正难的,反而不是模型不够强,
而是——
你有没有想清楚,要用它来干什么。
模型会继续卷,
但会用的人,已经开始悄悄拉开差距了。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。