搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

DeepSeek V4是什么？能做什么？
DeepSeek V4不只是聊天机器人，它是能真正干活的AI助手。一、DeepSeek V4是什么？ 2026年4月24日，DeepSeek发布V4预览版，两个版本： V4-Pro：完整版，Agent能力强，推理性能顶级 V4-Flash：轻量版，速度快，成本低核心能力：百万字上下文：一次能读1M " ) response = client.chat.completions.create( model="deepseek-v4-pro", # 或 deepseek-v4-flash 4 代码能力： V4-Pro接近Claude 4 Sonnet 长文本处理： V4（1M）> Claude（200K）成本： V4更低中文优化： V4更好 ▪ 5.3 vs DeepSeek V3 需要更高级功能，升级到Pro版一句话带走： DeepSeek V4不是聊天机器人，是你的AI工作伙伴。
2K10编辑于 2026-04-28
来自专栏代码简单说
DeepSeek-V4发布、DeepSeek API、OpenAI兼容调用、DeepSeek-V4教程、DeepSeek-V4-Pro与Flash区别
DeepSeek-V4发布、DeepSeek API、OpenAI兼容调用、DeepSeek-V4教程、DeepSeek-V4-Pro与Flash区别作为日常关注大模型API更新的开发者，今天一早就看到一个重磅消息：2026年4月24日，DeepSeek 正式发布 DeepSeek-V4 预览版并开源，同时 API 已同步升级。这篇文章帮你一次性搞懂： V4模型能力升级点 API变化与弃用提醒如何用 OpenAI SDK 直接调用 DeepSeek-V4（含Node示例）一、DeepSeek-V4 发布重点官方信息核心可以总结为 1️⃣ 新模型名称现在主要使用： deepseek-v4-pro deepseek-v4-flash 模型定位模型定位类比 deepseek-v4-pro 高性能推理 GPT-4级别 deepseek-v4 { role: "user", content: "Vue3 和 Vue2 最大区别是什么？"
88610编辑于 2026-06-16
DeepSeek免费超越GPT-4？
核心性能提升性能表现优异，直逼国际一流数学、编程、逻辑推理测试中，成绩国内领先整体表现已接近 GPT-4 和谷歌最新模型 AIME 数学竞赛准确率从 70% 大幅提升至87.5% 思考过程更加深入总结展望国产 AI 的重要突破 DeepSeek-R1 这次升级展现了国产 AI 在推理能力上的重大进步：性能达到国际先进水平：多项测试接近 GPT-4 表现完全免费开源：对开发者和研究者友好实用性强相关资源相关链接： Model Scope: https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528 Huggingface: https: //huggingface.co/deepseek-ai/DeepSeek-R1-0528 与之前的 DeepSeek-R1 版本一致，此次开源仓库（包括模型权重）统一采用 MIT License，允许用户利用模型输出数据库点击阅读 2.AI知识库的真相点击阅读 3.Cherry Studio 本地知识库搭建教程点击阅读 4.RAG知识库痛点与优化点击阅读 5.数据库接入大模型实战点击阅读 6.免费域名
33610编辑于 2026-04-29
来自专栏AI工程落地
DeepSeek V4模型原理
CompressedSparseAttention（CSA）这个Attention有三块功能构成：1.KVCompressor负责把N个token的KV压缩成1个，在DeepSeekV4系列模型里，N= 4。 2.LightningIndexer再从压缩后的KV里挑选top-k个KV参与注意力计算，DeepSeekV4Flash模型的k=512，Pro模型的k=1024。默认hc_mult=4模型入口处会把embedding复制成4条流：展开代码语言：PythonAI代码解释hidden_states=inputs_embeds.unsqueeze(2).expand( 4.comb：对原来的多条residualstream做动态混合，作为残差路径。5.最后post*Y+comb@X得到新的多流hidden。
34710编辑于 2026-05-09
来自专栏算法一只狗
DeepSeek 开源的FlashMLA到底是什么？
DeepSeek之前开源的FlashMLA，其github仓库代码已经来带了6000+的stars数量了，果然DeepSeek团队才是真正的OpenAI。它其实总结下来就是两个关键的信息适配DeepSeek中自研的MLA，能够有效加速MLA的推理速度。其实MLA技术一开始就是DeepSeek-V2中训练的一种方法。而DeepSeek-V2提出的MLA（Multi-Head Latent Attention），在KV缓存数量上略大于GQA（2.25组），但具备恢复完整MHA效果的能力。从部署使用上看，其用法相当简单，只需要安装对应的依赖，然后像下面一样调用即可DeepSeek团队在首日就开源了FlashMLA，相信在接下来的几天内，社区会有更多实践和应用落地。 DeepSeek正用行动证明，他们不仅仅是开源的践行者，更是AI技术普惠化的推动者。
39210编辑于 2025-03-18
来自专栏Java面试教程
DeepSeek-V4，终于发布，很强！
之前说过很多次的狼来了，这次狼是真的来了，推迟了 N 多次的 DeepSeek-V4 在经历过过程芯片适配，上线又回滚等多次事件后，终于如约而至。刚刚，DeepSeek 官方公众号发文：DeepSeek-V4 预览版：迈入百万上下文普惠时代。全新 DeepSeek-V4 的预览版本正式上线。 DeepSeek-V4-Flash，极致性价比，适合高频、简单任务，提供快速响应。简单推理和Agent能力媲美Pro版 DeepSeek-V4-Pro，极致性能，面向复杂逻辑、深度思考和高性能场景。现在登录官网什么，就已经是 V4了。根据官方的报道，DeepSeek-V4-Pro：性能比肩顶级闭源模型，什么叫做比肩顶级闭源模型。大家看看下面的对比图。 DeepSeek-V4 和 DeepSeek-V3.2 的 2、Agent 能力专项优化针对Claude Code、OpenCode、CodeBuddy等主流Agent产品进行了深度优化，在代码任务
1.1K30编辑于 2026-04-27
来自专栏Java面试教程
DeepSeek V4 真要来了！
大家可能听说过很多次，DeepSeek V4就要爱了，这一次可能是最靠谱的时间点了。就在上周，多位知情人士透露，DeepSeek创始人梁文锋在内部已经明确了节奏：下一代旗舰大模型V4，计划于4月下旬正式与公众见面。但这一次，DeepSeek V4干了一件牛逼的事情：完全运行在华为昇腾950PR芯片之上，底层代码从CUDA全面转向华为自研的CANN框架。这意味着什么？但其实我觉得 DeepSeek V4 虽然会比 V3 更好，但一定没有大家像之前期待的那么炸裂。我们应该用正常的眼光来看待更多“平凡、也会犯错的 DeepSeek"，哪怕崩溃了，V4 不那么惊艳，也并不影响 DeepSeek 的历史地位，已经它仍然是一家巨牛逼的公司。
41420编辑于 2026-04-20
来自专栏大模型系列
万字长文详解DeepSeek：DeepSeek是什么-超长上下文
成立不到三年，DeepSeek已发布包括DeepSeek-Coder、DeepSeek-MoE、DeepSeek-VL、DeepSeek-R1等多个重量级模型，在代码生成、混合专家架构、多模态理解与推理能力等方面实现多项突破本文将从技术演进、核心架构、开源生态、应用场景、产业影响五大维度，全面剖析DeepSeek的技术内核与发展路径。一、DeepSeek是什么？阶段三：迈向通用智能——DeepSeek-VL与DeepSeek-R1（2025–2026）DeepSeek-VL：支持图文理解、OCR、视觉问答等多模态任务。 4.多模态融合（DeepSeek-VL）采用Q-Former+VisionEncoder架构。支持图像描述、表格理解、手写识别等任务。可与语言模型无缝协同，实现“看图写代码”“读表做分析”等高级功能。支持4-bit/8-bit量化，可在消费级GPU（如RTX4090）运行。社区贡献活跃，衍生出大量微调版本（如DeepSeek-Math、DeepSeek-Law）。
6.3K60编辑于 2026-04-06
来自专栏DeepSeek 实战工坊
【DeepSeek实战】驾驭千亿参数：DeepSeek V4 Prompt 工程最佳实践
驾驭千亿参数：DeepSeek V4 Prompt 工程最佳实践摘要: DeepSeek V4 拥有强大的逻辑推理与代码生成能力，但如何"用好"它是一门艺术。结构化提示词框架 (CRISPE) 一个优秀的 Prompt 应包含以下要素：图2：CRISPE 框架六大要素及其在 DeepSeek V4 中的应用要素说明示例 C - Capacity/ 实测数据: 在数学推理任务中，CoT 可使 DeepSeek V4 的准确率从 68% 提升至 91%。图3：普通 Prompt vs CoT Prompt 在复杂逻辑任务中的准确率对比 3. JSON Mode 结构化输出 DeepSeek V4 支持强制输出 JSON 格式，极大简化后端解析逻辑。关注我，获取《DeepSeek V4 企业级应用实战》系列最新文章！ ✍️ 行文仓促，定有不足之处，欢迎各位朋友在评论区批评指正，不胜感激!
79720编辑于 2026-06-02
来自专栏大模型系列
0.2元百万Token 的万亿AI：DeepSeek-V4 开源，开启超长上下文普惠时代——DeepSeek-V4-Pro|DeepSeek-V4-Flash
2026年4月24日，国产大模型领域的领军者深度求索（DeepSeek）正式发布并开源其划时代的DeepSeek-V4Preview系列模型。此次发布不仅是技术上的重大突破，更是一场深刻的商业革命。本文将全面、深入地剖析DeepSeek-V4的技术内核、成本结构、应用场景及其对全球AI格局的深远影响。就在这一天，DeepSeek-V4的开源与发布，如同一声惊雷，打破了由硅谷巨头长期主导的高成本、高门槛AI生态。 1.3V4的核心价值主张DeepSeek-V4的价值主张清晰而有力：超长上下文普惠化：1MToken不再是实验室里的炫技，而是每个开发者和企业都能用得起的标准配置。 DeepSeek-V4正是这条道路上的一次重要实践。结论DeepSeek-V4的发布，是一场静悄悄却影响深远的革命。
1.7K40编辑于 2026-04-24
LLM 系列（二十）：解读 DeepSeek-V4
如果回头来看社区对于 DeepSeek-V4 的期待，我觉得可以把这句诗句颠倒一下：犹抱琵琶半遮面，千呼万唤始出来..... 关于 DeepSeek-V4 的使用和切换，这两天已经有相当多的技术博客做了实践和对比。一方面参数确实相较于之前的 671B 来看更大了，这是变化的，另一个方面 V4 继续沿用 MoE 的路线，这是不没变的，在有线算力的成本下，DeepSeek-V4 还是在成本控制方面保持了克制。 DeepSeek-V4 支持这一格式后，开发者通常只需要替换 base_url、api_key 和模型名，就能把已有系统平滑切换到 V4 上。 DeepSeek-V4 支持 Anthropic 风格接口，实际上是在主动适配这类执行环境。
90920编辑于 2026-04-27
来自专栏代码简单说
DeepSeek-V4-Pro API降价实测
DeepSeek-V4-Pro API降价实测关键词：DeepSeek API、DeepSeek V4 Pro、AI大模型价格、LLM API 对比、AI开发成本、AI接口调用教程最近在做 AI 项目成本测算时，突然发现 DeepSeek 刚发布了一条非常重要的消息：DeepSeek-V4-Pro API 限时大降价。一、DeepSeek-V4-Pro 限时 2.5 折官方刚发布： DeepSeek-V4-Pro 模型限时 2.5 折优惠截止：北京时间 2026/05/05 23:59 简单说：之前觉得二、DeepSeek V4 系列模型概览模型 deepseek-v4-flash deepseek-v4-pro BASE URL(OpenAI) https://api.deepseek.com https 模型版本 DeepSeek-V4-Flash DeepSeek-V4-Pro 思考模式支持思考/非思考模式切换支持上下文长度 1M tokens 1M tokens 最大输出 384K tokens
34210编辑于 2026-06-16
来自专栏机器学习与统计学
DeepSeek V4 Flash 量化版火了
简介事情其实是这样的：antirez 同步开源了两件配套的事： DeepSeek V4 Flash 的专用量化版 GGUF：托管在 huggingface.co/antirez/deepseek-v4 -gguf DwarfStar 4（简称 ds4）：一个专门为 DeepSeek V4 Flash 设计的推理引擎，托管在 github.com/antirez/ds4 注意定语：ds4 不是通用 GGUF ：文件适合场景量化重点 DeepSeek-V4-Flash-IQ2XXS-w2Q2K-... / 128GB / 192GB 内存的 Mac，又喜欢 DeepSeek V4 Flash，这套组合是当前能找到的"最爽配置"之一 4. 通用性差是事实不要指望它能跑 Qwen、Llama、其他 DeepSeek——它就只跑 V4 Flash，换模型就得换引擎总结 ds4 + DeepSeek V4 Flash GGUF 这套组合，是
1.3K10编辑于 2026-05-19
来自专栏技术人生黄勇
DeepSeek-V4 技术报告深度解析
摘要两个模型定位： DeepSeek-V4-Pro DeepSeek-V4-Flash 总参数 1.6T 284B 激活参数 49B 13B 定位旗舰版，追求最强性能轻量版，追求性价比概念： DeepSeek-V4 的基础设施工作有两个特点：全栈自研和软硬件协同设计。 FP4 量化感知训练量化感知训练（QAT）：在训练过程中模拟量化带来的精度损失，让模型提前适应，这样部署时用低精度权重不会掉精度。 DeepSeek-V4 对两部分做 FP4 量化： 1. DeepSeek-V4 的异构 KV 缓存管理更复杂，但这是混合注意力架构的必然代价。弹性计算沙箱平台论文地址： https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf -END-
1.5K10编辑于 2026-04-28
来自专栏大模型系列
华为昇腾950+DeepSeek V4王炸组合！雷军式定价屠夫登场，小米模式席卷AI界—DeepSeek-V4-Pro|DeepSeek-V4
DeepSeek-V4的横空出世，不仅在技术上实现了全面越级，更在定价策略上投下了一枚震撼弹！128K上下文？那已经是上个时代的标配。V4直接把1M超长上下文拉满，让百万字级别的文档处理变得轻而易举。就在刚刚，DeepSeek官方公布了V4的API价格表。我拿到数据后，足足愣了半分钟，心里只有一个念头：这哪是定价，这简直是掀桌子！这是什么概念？意味着你可以把一整套《红楼梦》塞进模型里做分析，成本还不到五毛钱！顶级AI能力，正在变得像水电煤一样便宜、普惠。 DeepSeek这是要学当年的小米，用极致性价比，把大模型市场里那些虚高的溢价，彻底打回原形！但DeepSeek此举，等于向全世界宣告：V4不仅能在昇腾芯片上完美运行，而且即将构建起基于国产硬件的超大规模算力集群！从模型到芯片，软硬一体的全栈国产化闭环正在形成。
50540编辑于 2026-04-24
来自专栏技术热文
DeepSeek R1 集成难题完美解决：DeepSeek4j来帮你解决
DeepSeek R1 集成难题完美解决：DeepSeek4j来帮你解决在人工智能技术飞速发展的今天，DeepSeek R1 凭借其强大的思维链能力和高效的性能，成为开发者们关注的焦点。幸运的是，DeepSeek4j 的开源为这一难题提供了完美的解决方案。为什么需要 DeepSeek4j？ DeepSeek4j 的优势DeepSeek4j 是专为 Java 生态打造的 DeepSeek R1 集成框架，其核心优势如下：完整保留思维链和账单：完美支持 DeepSeek R1 的思维链能力，确保推理过程完整保留如何在 Spring Boot 项目中快速集成 DeepSeek4j环境准备在集成 DeepSeek4j 之前，确保开发环境满足以下条件：Java 版本：DeepSeek4j 支持 Java 8 及以上版本来使用 DeepSeek4j 提供的 API。
44010编辑于 2025-03-31
来自专栏DeepSeek 实战工坊
【DeepSeek 实战】打造全能编程助手：DeepSeek V4 Agent 开发与工具调用
打造全能编程助手：DeepSeek V4 Agent 开发与工具调用摘要: Agent（智能体）是大模型应用的高级形态。本文详解如何利用 DeepSeek V4 的 Function Calling 能力，构建能够自主调用外部工具的编程助手。 V4 强大的 Function Calling 能力使其能够理解工具的功能描述，并在需要时主动调用。定义工具 Schema 首先，我们需要告诉 DeepSeek V4 有哪些工具可用，以及每个工具的参数格式。如果有问题，生成修复后的代码并执行验证 4.
59610编辑于 2026-06-03
来自专栏码匠的流水账
langchain4j+ollama+deepseek小试牛刀
序本文主要研究一下如何使用langchain4j集成ollama+deepseek步骤pom.xml <dependency> <groupId>dev.langchain4j langchain4j-spring.version}</version> </dependency> <dependency> <groupId>dev.langchain4j model-name: deepseek-r1:8bcontroller@RequestMapping("/ollama")@RestControllerpublic class ChatController prompt=%E4%BD%A0%E6%98%AF%E8%B0%81可以得到您好！我是由中国的深度求索（DeepSeek）公司开发的智能助手DeepSeek-R1。小结langchain4j提供了langchain4j-ollama-spring-boot-starter，可以方便地通过ollama去访问deepseek。doclangchain4j
1.4K00编辑于 2025-02-23
来自专栏一臻AI
DeepSeek之后，10万一个的Manus到底是什么？
这画面，不禁让我想起几年前刚推出GPT-4时的疯狂。但是...等等，Manus到底是个啥？为什么突然这么火？从"AI会说"到"AI会做"的飞跃如果说ChatGPT和DeepSeek只是会说话的AI，那Manus就是真正会干活的AI。以前你对AI说："帮我分析这些简历。" 阅读Github上的代码，理解项目结构并绘制系统架构图 4. 多模态内容生成（可输出PPT/HTML/音视频） 4. 多代理协同工作系统它甚至在AI"高考"GAIA测试中超越了OpenAI，展现出了惊人的任务拆解和执行能力。继DeepSeek之后，又一个让全球瞩目的国产AI产品诞生了。创始人是90后，之前做过壹伴助手这个产品（很多公众号作者都在用），然后卖掉后继续创业，现在又带来了Manus这个颠覆性产品。
28510编辑于 2025-03-07
来自专栏码匠的流水账
langchain4j+ollama+deepseek小试牛刀
序本文主要研究一下如何使用langchain4j集成ollama+deepseek 步骤 pom.xml <dependency> <groupId>dev.langchain4j >dev.langchain4j</groupId> <artifactId>langchain4j-ollama-spring-boot-starter</artifactId :11434 model-name: deepseek-r1:8b controller @RequestMapping("/ollama") @RestController public prompt=%E4%BD%A0%E6%98%AF%E8%B0%81 可以得到您好！我是由中国的深度求索（DeepSeek）公司开发的智能助手DeepSeek-R1。小结 langchain4j提供了langchain4j-ollama-spring-boot-starter，可以方便地通过ollama去访问deepseek。 doc langchain4j
59610编辑于 2025-02-25

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

DeepSeek V4是什么？能做什么？

DeepSeek-V4发布、DeepSeek API、OpenAI兼容调用、DeepSeek-V4教程、DeepSeek-V4-Pro与Flash区别

DeepSeek免费超越GPT-4？

DeepSeek V4模型原理

DeepSeek 开源的FlashMLA到底是什么？

DeepSeek-V4，终于发布，很强！

DeepSeek V4 真要来了！

万字长文详解DeepSeek：DeepSeek是什么-超长上下文

【DeepSeek实战】驾驭千亿参数：DeepSeek V4 Prompt 工程最佳实践

0.2元百万Token 的万亿AI：DeepSeek-V4 开源，开启超长上下文普惠时代——DeepSeek-V4-Pro|DeepSeek-V4-Flash

LLM 系列（二十）：解读 DeepSeek-V4

DeepSeek-V4-Pro API降价实测

DeepSeek V4 Flash 量化版火了

DeepSeek-V4 技术报告深度解析

华为昇腾950+DeepSeek V4王炸组合！雷军式定价屠夫登场，小米模式席卷AI界—DeepSeek-V4-Pro|DeepSeek-V4

DeepSeek R1 集成难题完美解决：DeepSeek4j来帮你解决

【DeepSeek 实战】打造全能编程助手：DeepSeek V4 Agent 开发与工具调用

langchain4j+ollama+deepseek小试牛刀

DeepSeek之后，10万一个的Manus到底是什么？

langchain4j+ollama+deepseek小试牛刀

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐