搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏大模型系列
万字长文详解DeepSeek：DeepSeek是什么-超长上下文
成立不到三年，DeepSeek已发布包括DeepSeek-Coder、DeepSeek-MoE、DeepSeek-VL、DeepSeek-R1等多个重量级模型，在代码生成、混合专家架构、多模态理解与推理能力等方面实现多项突破阶段三：迈向通用智能——DeepSeek-VL与DeepSeek-R1（2025–2026）DeepSeek-VL：支持图文理解、OCR、视觉问答等多模态任务。 4.多模态融合（DeepSeek-VL）采用Q-Former+VisionEncoder架构。支持图像描述、表格理解、手写识别等任务。可与语言模型无缝协同，实现“看图写代码”“读表做分析”等高级功能。
3.2K60编辑于 2026-04-06
来自专栏大模型系列
DeepSeek 技术如何推动多模态融合？——从架构创新到产业落地的万字全景解析
2024年，DeepSeek发布DeepSeek-VL系列多模态大模型，标志着其正式从“纯语言模型”向“通用感知-认知智能体”跃迁。凭借完全开源、免费商用、性能卓越三大特性，DeepSeek-VL迅速成为全球开发者构建多模态应用的首选基座。 2.3端到端视觉语言对齐：Q-Former+多头潜在注意力DeepSeek-VL系列采用Q-Former（QueryingTransformer）作为视觉-语言桥梁：工作流程：视觉编码器（DINOv2- 三、训练策略：数据、阶段与优化3.1多阶段训练流程DeepSeek-VL的训练分为三个关键阶段：阶段目标数据集优化技巧1.适配器训练对齐视觉与语言空间LAION-400M,COCOCaptions冻结主干从一张模糊的发票到一份复杂的科研图表，DeepSeek-VL正在让机器“真正看懂世界”。这场多模态革命，才刚刚开始。
32320编辑于 2026-04-05
来自专栏大模型系列
DeepSeek模型全解析：DeepSeek核心差异与应用场景指南-DeepSeek 凭什么脱颖而出？
从专精代码的DeepSeek-Coder，到混合专家架构的DeepSeek-MoE，再到多模态融合的DeepSeek-VL与强化推理的DeepSeek-R1/V3.2，其产品矩阵已覆盖语言、代码、数学、 4.多模态交互推荐模型：DeepSeek-VL应用场景：电商：商品图→自动撰写详情页文案教育：手写作业拍照→批改+错题解析办公：扫描表格→转Excel/JSON硬件要求：RTX4090可流畅运行7B版本
1.6K50编辑于 2026-04-06
来自专栏大模型系列
万字长文拆解DeepSeek大模型技术演进-Coder/LLM/混合专家（MoE）/VL/R1 / V3.2-超长上下文处理、动态稀疏注意力（DSA）
阶段三：多模态融合（2024–2025）——DeepSeek-VL目标：打破纯文本限制，实现图文协同理解。架构：视觉编码器：基于DINOv2预训练的ViT。 DeepSeek-VL标志着其从“语言模型”向“多模态智能体”转型。阶段四：推理强化（2025–2026）——DeepSeek-R1/V3.2核心挑战：提升复杂任务的逻辑推理与自我纠错能力。
1.2K20编辑于 2026-04-06
来自专栏腾讯云迁移
DeepSeek已登陆腾讯云？！
多模态融合创新跨模态统一架构：视觉-语言模型DeepSeek-VL支持10种图像标注任务，在医疗影像分析场景达到放射科专家95%的准确率。
1.9K40编辑于 2025-02-26
边缘 AI 新玩法：在 ZYNQ 本地部署 DeepSeek 模型
DeepSeek-VL（视觉-语言版本）扩展支持图像数据与文本监督，能够进行跨模态推理、视觉问答、图片-文本生成。其还提供量化版本（4 bit、8 bit）以适配边缘设备与移动部署。
16510编辑于 2026-03-23
来自专栏AIGC新知
行业新知 | DeepSeek在医疗领域的典型应用场景
脑部疾病检测：在脑出血、脑肿瘤识别中，DeepSeek-VL模型通过异常部位定位技术，准确率可达三甲医院主治医师水平。画像诊断支援 X 射线、CT 和 MRI 分析：使用 DeepSeek-VL 识别异常部位（例如，检测肺癌、脑出血、骨关节炎）。病理图像分析：利用 DeepSeek 自动检测和分类癌细胞。
4.9K20编辑于 2025-02-26
DeepSeek: 中国AI新锐的崛起之路
公司成立不到一年，DeepSeek便发布了一系列大语言模型，包括DeepSeek-LLM、DeepSeek-Coder、DeepSeek-MoE、DeepSeek-VL等，展现出强大的研发能力和技术实力
51010编辑于 2025-04-03
深度用户看过来：无需等待的DeepSeek终极方案，从此告别『服务器繁忙』弹窗
DeepSeek的主要产品包括DeepSeek LLM、DeepSeek-V2、DeepSeek-V3、DeepSeek Coder、DeepSeek Math、DeepSeek-VL等。
25500编辑于 2025-03-01
来自专栏深度学习与python
软件开发范式变了！首届 AICon 深圳站，来讲你的 AI 开发绝活！
从 GPT-3 到 GPT-4o，从 Claude 2 到 Claude 3.5 Sonnet，从通义千问到 DeepSeek-VL，再到层出不穷的 Agent 框架（如 LangChain, LlamaIndex
39900编辑于 2025-06-25
来自专栏一个正经的程序员
DeepSeek 横空出世，爆火全球，再不了解和学习你真的就 out 了！
3月11日，发布 DeepSeek-VL。 5月7日，发布 DeepSeek-V2。 6月17日，发布 DeepSeek-Coder-V2。
1.2K10编辑于 2025-02-04
来自专栏LLM
3年，从0到全球领跑：万字长文拆解DeepSeek大模型技术演进
DeepSeek-VL：迈向真实世界的视觉理解发布时间： 2024年3月11日核心定位：多模态理解模型技术创新：混合视觉编码器（Hybrid Vision Encoder）论文: https://arxiv.org /abs/2403.05525 github: https://github.com/deepseek-ai/DeepSeek-VL DeepSeek-VL（1.3B/7B）的设计哲学是实用主义。不同于当时许多多模态模型专注于简短的看图说话，DeepSeek-VL着重于处理真实世界中的复杂视觉任务，如逻辑图表分析、网页代码转换、OCR识别等。
1.2K10编辑于 2026-02-12
来自专栏OpenMMLab
丝滑小连招，部署 Vision Language 模型
llava internvl internlm-xcomposer2 qwen-vl deepseek-vl minigemini yi-vl LMDeploy 项目链接 https://github.com
64010编辑于 2024-06-04
来自专栏AIGC 先锋科技
中科大 & 腾讯微信 & 新加坡国立大学 & 复旦等将视觉特征与 LLM 的参数空间对齐，LoRA 再升级，效率更上一层！
DeepSeek-VL [39] 和Sphinx [30] 也采用了混合视觉编码器。Vary [55] 识别出固定的视觉词汇限制了密集和细粒度的视觉感知，并引入了一种新的词汇以解决此问题。遵循这一范式的研究进一步从视觉编码器和投影器的角度改进MLLMs，DeepSeek-VL [39] 使用SigLip [58] 提取高级语义特征并使用SAM-B [20] 处理低级特征。具体来说，LLaVA [32] 和DeepSeek-VL [39] 利用576个视觉标记，Sphinx-2k [30] 使用2,890个视觉标记，而InternLM-Xcomposer2-4KHD [11
74610编辑于 2024-07-08
来自专栏AIGC 先锋科技
中科大 & 腾讯微信提出 EE-MLLM，一种数据高效和计算高效的多模大型语言模型!
具体来说，LLaVA Liu等人和Deepseek-VL Lu等人分别具有576个视觉标记。Sphinx Lin等人则使用了2890个视觉标记。 DeepSeek-VL Lu等人（2024年）采用混合视觉编码器，包括SigLIP的Zhai等人（2023年）用于高级语义特征和SAM-B的Kirillov等人（2023年）用于低级特征。如表1所示，根据Deepseek-VL [14]，作者的监督微调数据包括开源的gpt4v数据集，包括ShareGPT4V [4]，LVIS-Instruct4V [22]，LAION-GPT4V（LAION
75010编辑于 2024-08-30
来自专栏IT从业者张某某
大语言模型-1.3-GPT、DeepSeek模型介绍
系列模型的技术演变 DeepSeek系列模型发展历程 ➢ 训练框架：HAI-LLM ➢ 语言大模型：DeepSeek LLM/V2/V3、Coder/Coder-V2、Math ➢ 多模态大模型：DeepSeek-VL
1.2K00编辑于 2025-03-15
来自专栏Datawhale专栏
完整解读：从DeepSeek Janus到Janus-Pro！
；表格和图表数据：来自 DeepSeek-VL 的相应表格和图表数据，数据格式为 <question><answer>；视觉生成数据：来自多个数据集的 image-caption
1.9K40编辑于 2025-02-05
来自专栏AI分享
DeepSeek的提示词技巧
2024年3月11日：DeepSeek-VL发布，引入了视觉语言融合技术，拓展了模型的应用场景。 2024年5月7日：DeepSeek-V2版本发布，优化了语言生成的流畅度和准确性。
4.3K21编辑于 2025-03-04
来自专栏大模型系列
DeepSeek是什么？一文看懂国产开源大模型 DeepSeek 的功能、特点与使用方法
DeepSeek），凭借三款产品迅速出圈： DeepSeek-Coder：性能超越 CodeLlama-34B 的开源代码大模型； DeepSeek-MoE：以稀疏激活实现“小成本、大性能”的混合专家模型； DeepSeek-VL
5.2K40编辑于 2026-03-27
来自专栏大模型系列
DeepSeek 的开源策略对行业有何影响？——万字深度解析DeepSeek之全栈开源、免费商用、极致性能
1.1“全栈开源”：不止于模型权重与部分厂商仅开源模型权重不同，DeepSeek奉行真正意义上的全栈开源：模型权重：从DeepSeek-LLM、DeepSeek-Coder到DeepSeek-MoE、DeepSeek-VL
63120编辑于 2026-04-05

第 2 页

万字长文详解DeepSeek：DeepSeek是什么-超长上下文

DeepSeek 技术如何推动多模态融合？——从架构创新到产业落地的万字全景解析

DeepSeek模型全解析：DeepSeek核心差异与应用场景指南-DeepSeek 凭什么脱颖而出？

万字长文拆解DeepSeek大模型技术演进-Coder/LLM/混合专家（MoE）/VL/R1 / V3.2-超长上下文处理、动态稀疏注意力（DSA）

DeepSeek已登陆腾讯云？！

边缘 AI 新玩法：在 ZYNQ 本地部署 DeepSeek 模型

行业新知 | DeepSeek在医疗领域的典型应用场景

DeepSeek: 中国AI新锐的崛起之路

深度用户看过来：无需等待的DeepSeek终极方案，从此告别『服务器繁忙』弹窗

软件开发范式变了！首届 AICon 深圳站，来讲你的 AI 开发绝活！

DeepSeek 横空出世，爆火全球，再不了解和学习你真的就 out 了！

3年，从0到全球领跑：万字长文拆解DeepSeek大模型技术演进

丝滑小连招，部署 Vision Language 模型

中科大 & 腾讯微信 & 新加坡国立大学 & 复旦等将视觉特征与 LLM 的参数空间对齐，LoRA 再升级，效率更上一层！

中科大 & 腾讯微信提出 EE-MLLM，一种数据高效和计算高效的多模大型语言模型!

大语言模型-1.3-GPT、DeepSeek模型介绍

完整解读：从DeepSeek Janus到Janus-Pro！

DeepSeek的提示词技巧

DeepSeek是什么？一文看懂国产开源大模型 DeepSeek 的功能、特点与使用方法

DeepSeek 的开源策略对行业有何影响？——万字深度解析DeepSeek之全栈开源、免费商用、极致性能

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

万字长文详解DeepSeek：DeepSeek是什么-超长上下文

DeepSeek 技术如何推动多模态融合？——从架构创新到产业落地的万字全景解析

DeepSeek模型全解析：DeepSeek核心差异与应用场景指南-DeepSeek 凭什么脱颖而出？

万字长文拆解DeepSeek大模型技术演进-Coder/LLM/混合专家（MoE）/VL/R1 / V3.2-超长上下文处理、动态稀疏注意力（DSA）

DeepSeek已登陆腾讯云？！

边缘 AI 新玩法：在 ZYNQ 本地部署 DeepSeek 模型

行业新知 | DeepSeek在医疗领域的典型应用场景

DeepSeek: 中国AI新锐的崛起之路

深度用户看过来：无需等待的DeepSeek终极方案，从此告别『服务器繁忙』弹窗

软件开发范式变了！首届 AICon 深圳站，来讲你的 AI 开发绝活！

DeepSeek 横空出世，爆火全球，再不了解和学习你真的就 out 了！

3年，从0到全球领跑：万字长文拆解DeepSeek大模型技术演进

丝滑小连招，部署 Vision Language 模型

​中科大 & 腾讯微信 & 新加坡国立大学 & 复旦等 将视觉特征与 LLM 的参数空间对齐，LoRA 再升级， 效率更上一层！

中科大 & 腾讯微信提出 EE-MLLM，一种数据高效和计算高效的多模大型语言模型!

大语言模型-1.3-GPT、DeepSeek模型介绍

完整解读：从DeepSeek Janus到Janus-Pro！

DeepSeek的提示词技巧

DeepSeek是什么？一文看懂国产开源大模型 DeepSeek 的功能、特点与使用方法

DeepSeek 的开源策略对行业有何影响？——万字深度解析DeepSeek之全栈开源、免费商用、极致性能

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

中科大 & 腾讯微信 & 新加坡国立大学 & 复旦等将视觉特征与 LLM 的参数空间对齐，LoRA 再升级，效率更上一层！