AI 深度观察 · 2026 年 4 月 25 日 沉默五个月后,DeepSeek 把答案亮出来了
4 月 24 日,DeepSeek 正式发布 V4 系列,同步开源。这是它沉默五个月后的第一次亮相。发布报告里有一句话值得细品:「不诱于誉,不恐于诽,率道而行,端然正己。」——荀子《非十二子》。
有意思的是,这家公司在技术报告里对自己的能力上限说得相当诚实:V4-Pro 在 Agent 任务上体验优于 Claude Sonnet 4.5,但「仍与 Claude Opus 4.6 思考模式存在一定差距」。这种坦诚,反而让整份报告格外有份量。
"DeepSeek V4 不需要在每一项评测上赢,它只需要足够好,然后让价格做剩下的工作。"
V4 系列分两款,都是混合专家模型(MoE),都原生支持 100 万 token 的超长上下文,并同步开源(MIT 协议)。
版本 | 总参数 | 激活参数 | 定位 |
|---|---|---|---|
DeepSeek-V4-Pro | 1.6 万亿 | 49B | 旗舰性能,对标顶级闭源模型 |
DeepSeek-V4-Flash | 2840 亿 | 13B | 经济高效,速度更快成本更低 |
两款模型均支持思考模式(reasoning_effort 可选 high / max)和非思考模式切换,并已针对 Claude Code、OpenClaw、OpenCode 等主流 Agent 产品做了专项适配。
架构上,V4 引入了全新的 DSA 稀疏注意力机制(DeepSeek Sparse Attention),在不降低长上下文能力的前提下,大幅压低了显存和算力消耗——这不只是技术炫技,它直接决定了 API 的定价空间。
DeepSeek 在官方报告中,主动列出了与 Claude Opus 4.6、GPT-5.4 和 Gemini-3.1-Pro 的对比。结果是:有赢、有输,说得清楚。
评测项 | DeepSeek V4-Pro | Claude Opus 4.6 | V4 表现 |
|---|---|---|---|
LiveCodeBench 代码生成 | 93.5% | 88.8% | ✅ 领先 |
SWE-Bench 软件工程 | 55.4% | 64.3% | ❌ 落后 |
GPQA Diamond 学术推理 | 90.1% | 94.2% | ❌ 落后 |
HLE 人类终极考试(无工具) | 37.7% | 46.9% | ❌ 落后 |
BrowseComp 网页浏览 Agent | 83.4% | 79.3% | ✅ 领先 |
Codeforces 竞赛编程 | 3206 分 | — | ✅ 开源最强 |
结论很清晰:代码生成和 Agent 浏览能力上,V4-Pro 已经超越或持平最顶级的闭源模型;但在复杂多步推理、深度学术问题、软件工程综合能力上,Claude Opus 4.6 思考版仍然有明显优势。
DeepSeek 自己的内部评测也承认:「Agent Coding 体验优于 Sonnet 4.5,接近 Opus 4.6 非思考模式,但与 Opus 4.6 思考模式仍有差距。」
值得注意:DeepSeek 内部员工已将 V4 作为日常 Agentic Coding 工具,并在报告中直接写明"内部已经在实际编码工作中用 V4 替换了 Claude"。这是一个态度信号,不只是跑分。
能力上差一口气,价格上直接打穿。这是 V4 最核心的价值主张。
模型 | 输入(每百万 token) | 输出(每百万 token) |
|---|---|---|
DeepSeek V4-Flash | ¥1 元(缓存命中 ¥0.2 元) | ¥2 元 |
DeepSeek V4-Pro | ¥12 元(缓存命中 ¥1 元) | ¥24 元 |
Claude Opus 4.6 | 约 ¥36 元($5) | 约 ¥180 元($25) |
GPT-5.5 | 约 ¥36 元($5) | 约 ¥216 元($30) |
换算一下:同等性能区间里,V4-Pro 的输出成本约为 Claude Opus 4.6 的 七分之一,V4-Flash 的输出成本更是不到 Claude 的百分之一。而且官网和 App 端使用仍然免费。
美国科技媒体 VentureBeat 的评价是:「DeepSeek 不需要赢下每一项评测,价格就已经是最大的标题。」
注:V4-Pro 当前定价受限于高端算力产能,是过渡价而非最终价。随着下半年华为昇腾 950 批量上市,Pro 版本价格大幅下调后,将进一步拉大与海外闭源模型的价格差距。
100 万 token 的上下文,意味着你可以把一本几十万字的长篇小说、一份完整的合同或产品手册,整个喂给它分析——不用自己切片、分段。这之前是付费用户的专属福利,现在是所有人的标配。
你用的很多 AI 产品——翻译工具、写作助手、客服机器人——背后的 API 成本会因为 V4 的发布而集体下降。竞争压力会传导到定价,最终受益的是终端用户。
用 AI 辅助编程的开发者,之前要在效果和成本之间做艰难取舍。现在 V4-Pro 在代码生成上已经超过 Claude Sonnet 4.5,价格却只有其零头,选择不再那么痛苦。
MIT 协议开源,意味着国内外的开发者可以直接拿走、部署、改造。面向垂直行业的私有化部署——医疗、法律、政务——会因此加速落地,数据不出本地,合规有保障。
V4 下半年将正式支持华为昇腾算力。一旦顶级模型能稳定跑在国产芯片上,对整个产业链的意义远不止一家公司的技术路线。英伟达生态的垄断护城河,会开始松动。
DeepSeek V4 不是现在最强的模型。Claude Opus 4.6 的思考版在复杂推理上仍然领先;GPT-5.5 在某些 Agent 任务上依然更稳。
但 V4 的发布真正改变了这个行业的成本曲线。当旗舰级开源模型的价格是顶级闭源模型的六分之一,当百万 token 的上下文从高端特权变成基本配置,当顶级代码生成能力第一次以如此低廉的价格触手可及——
这意味着,过去只有大公司才能负担的 AI 能力,正在成为每一个人都能用上的基础设施。
这,才是 DeepSeek V4 最重要的地方。
本文分享自 PM智圈-PMAIhub 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!