首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏大模型系列

    万字长文详解DeepSeek:DeepSeek是什么-超长上下文

    成立不到三年,DeepSeek已发布包括DeepSeek-Coder、DeepSeek-MoE、DeepSeek-VL、DeepSeek-R1等多个重量级模型,在代码生成、混合专家架构、多模态理解与推理能力等方面实现多项突破 阶段三:迈向通用智能——DeepSeek-VL与DeepSeek-R1(2025–2026)DeepSeek-VL:支持图文理解、OCR、视觉问答等多模态任务。 4.多模态融合(DeepSeek-VL)采用Q-Former+VisionEncoder架构。支持图像描述、表格理解、手写识别等任务。可与语言模型无缝协同,实现“看图写代码”“读表做分析”等高级功能。

    3.2K60编辑于 2026-04-06
  • 来自专栏大模型系列

    DeepSeek 技术如何推动多模态融合?——从架构创新到产业落地的万字全景解析

    2024年,DeepSeek发布DeepSeek-VL系列多模态大模型,标志着其正式从“纯语言模型”向“通用感知-认知智能体”跃迁。 凭借完全开源、免费商用、性能卓越三大特性,DeepSeek-VL迅速成为全球开发者构建多模态应用的首选基座。 2.3端到端视觉语言对齐:Q-Former+多头潜在注意力DeepSeek-VL系列采用Q-Former(QueryingTransformer)作为视觉-语言桥梁:工作流程:视觉编码器(DINOv2- 三、训练策略:数据、阶段与优化3.1多阶段训练流程DeepSeek-VL的训练分为三个关键阶段:阶段目标数据集优化技巧1.适配器训练对齐视觉与语言空间LAION-400M,COCOCaptions冻结主干 从一张模糊的发票到一份复杂的科研图表,DeepSeek-VL正在让机器“真正看懂世界”。这场多模态革命,才刚刚开始。

    32320编辑于 2026-04-05
  • 来自专栏大模型系列

    DeepSeek模型全解析:DeepSeek核心差异与应用场景指南-DeepSeek 凭什么脱颖而出?

    从专精代码的DeepSeek-Coder,到混合专家架构的DeepSeek-MoE,再到多模态融合的DeepSeek-VL与强化推理的DeepSeek-R1/V3.2,其产品矩阵已覆盖语言、代码、数学、 4.多模态交互推荐模型:DeepSeek-VL应用场景:电商:商品图→自动撰写详情页文案教育:手写作业拍照→批改+错题解析办公:扫描表格→转Excel/JSON硬件要求:RTX4090可流畅运行7B版本

    1.6K50编辑于 2026-04-06
  • 来自专栏大模型系列

    万字长文拆解DeepSeek大模型技术演进-Coder/LLM/混合专家(MoE)/VL/R1 / V3.2-超长上下文处理、动态稀疏注意力(DSA)

    阶段三:多模态融合(2024–2025)——DeepSeek-VL目标:打破纯文本限制,实现图文协同理解。架构:视觉编码器:基于DINOv2预训练的ViT。 DeepSeek-VL标志着其从“语言模型”向“多模态智能体”转型。阶段四:推理强化(2025–2026)——DeepSeek-R1/V3.2核心挑战:提升复杂任务的逻辑推理与自我纠错能力。

    1.2K20编辑于 2026-04-06
  • 来自专栏腾讯云迁移

    DeepSeek已登陆腾讯云?!

    多模态融合创新跨模态统一架构:视觉-语言模型DeepSeek-VL支持10种图像标注任务,在医疗影像分析场景达到放射科专家95%的准确率。

    1.9K40编辑于 2025-02-26
  • 边缘 AI 新玩法:在 ZYNQ 本地部署 DeepSeek 模型

    DeepSeek-VL(视觉-语言版本)扩展支持图像数据与文本监督,能够进行跨模态推理、视觉问答、图片-文本生成。 其还提供量化版本(4 bit、8 bit)以适配边缘设备与移动部署。

    16510编辑于 2026-03-23
  • 来自专栏AIGC新知

    行业新知 | DeepSeek在医疗领域的典型应用场景

    脑部疾病检测:在脑出血、脑肿瘤识别中,DeepSeek-VL模型通过异常部位定位技术,准确率可达三甲医院主治医师水平。 画像诊断支援 X 射线、CT 和 MRI 分析:使用 DeepSeek-VL 识别异常部位(例如,检测肺癌、脑出血、骨关节炎)。 病理图像分析:利用 DeepSeek 自动检测和分类癌细胞。

    4.9K20编辑于 2025-02-26
  • DeepSeek: 中国AI新锐的崛起之路

    公司成立不到一年,DeepSeek便发布了一系列大语言模型,包括DeepSeek-LLM、DeepSeek-Coder、DeepSeek-MoE、DeepSeek-VL等,展现出强大的研发能力和技术实力

    51010编辑于 2025-04-03
  • 深度用户看过来:无需等待的DeepSeek终极方案,从此告别『服务器繁忙』弹窗

    DeepSeek的主要产品包括DeepSeek LLM、DeepSeek-V2、DeepSeek-V3、DeepSeek Coder、DeepSeek Math、DeepSeek-VL等。

    25500编辑于 2025-03-01
  • 来自专栏深度学习与python

    软件开发范式变了!首届 AICon 深圳站,来讲你的 AI 开发绝活!

    从 GPT-3 到 GPT-4o,从 Claude 2 到 Claude 3.5 Sonnet,从通义千问到 DeepSeek-VL,再到层出不穷的 Agent 框架(如 LangChain, LlamaIndex

    39900编辑于 2025-06-25
  • 来自专栏一个正经的程序员

    DeepSeek 横空出世,爆火全球,再不了解和学习你真的就 out 了!

    3月11日,发布 DeepSeek-VL。 5月7日,发布 DeepSeek-V2。 6月17日,发布 DeepSeek-Coder-V2。

    1.2K10编辑于 2025-02-04
  • 来自专栏LLM

    3年,从0到全球领跑:万字长文拆解DeepSeek大模型技术演进

    DeepSeek-VL:迈向真实世界的视觉理解发布时间: 2024年3月11日核心定位: 多模态理解模型技术创新: 混合视觉编码器(Hybrid Vision Encoder)论文: https://arxiv.org /abs/2403.05525 github: https://github.com/deepseek-ai/DeepSeek-VL DeepSeek-VL(1.3B/7B)的设计哲学是实用主义。 不同于当时许多多模态模型专注于简短的看图说话,DeepSeek-VL着重于处理真实世界中的复杂视觉任务,如逻辑图表分析、网页代码转换、OCR识别等。

    1.2K10编辑于 2026-02-12
  • 来自专栏OpenMMLab

    丝滑小连招,部署 Vision Language 模型

    llava internvl internlm-xcomposer2 qwen-vl deepseek-vl minigemini yi-vl LMDeploy 项目链接 https://github.com

    64010编辑于 2024-06-04
  • 来自专栏AIGC 先锋科技

    ​中科大 & 腾讯微信 & 新加坡国立大学 & 复旦等 将视觉特征与 LLM 的参数空间对齐,LoRA 再升级, 效率更上一层!

    DeepSeek-VL [39] 和Sphinx [30] 也采用了混合视觉编码器。Vary [55] 识别出固定的视觉词汇限制了密集和细粒度的视觉感知,并引入了一种新的词汇以解决此问题。 遵循这一范式的研究进一步从视觉编码器和投影器的角度改进MLLMs,DeepSeek-VL [39] 使用SigLip [58] 提取高级语义特征并使用SAM-B [20] 处理低级特征。 具体来说,LLaVA [32] 和DeepSeek-VL [39] 利用576个视觉标记,Sphinx-2k [30] 使用2,890个视觉标记,而InternLM-Xcomposer2-4KHD [11

    74610编辑于 2024-07-08
  • 来自专栏AIGC 先锋科技

    中科大 & 腾讯微信提出 EE-MLLM,一种数据高效和计算高效的多模大型语言模型!

    具体来说,LLaVA Liu等人和Deepseek-VL Lu等人分别具有576个视觉标记。Sphinx Lin等人则使用了2890个视觉标记。 DeepSeek-VL Lu等人(2024年)采用混合视觉编码器,包括SigLIP的Zhai等人(2023年)用于高级语义特征和SAM-B的Kirillov等人(2023年)用于低级特征。 如表1所示,根据Deepseek-VL [14],作者的监督微调数据包括开源的gpt4v数据集,包括ShareGPT4V [4],LVIS-Instruct4V [22],LAION-GPT4V(LAION

    75010编辑于 2024-08-30
  • 来自专栏IT从业者张某某

    大语言模型-1.3-GPT、DeepSeek模型介绍

    系列模型的技术演变 DeepSeek系列模型发展历程 ➢ 训练框架:HAI-LLM ➢ 语言大模型:DeepSeek LLM/V2/V3、Coder/Coder-V2、Math ➢ 多模态大模型:DeepSeek-VL

    1.2K00编辑于 2025-03-15
  • 来自专栏Datawhale专栏

    完整解读:从DeepSeek Janus到Janus-Pro!

    ; 表格和图表数据:来自 DeepSeek-VL 的相应表格和图表数据,数据格式为 <question><answer>; 视觉生成数据:来自多个数据集的 image-caption

    1.9K40编辑于 2025-02-05
  • 来自专栏AI分享

    DeepSeek的提示词技巧

    2024年3月11日:DeepSeek-VL发布,引入了视觉语言融合技术,拓展了模型的应用场景。 2024年5月7日:DeepSeek-V2版本发布,优化了语言生成的流畅度和准确性。

    4.3K21编辑于 2025-03-04
  • 来自专栏大模型系列

    DeepSeek是什么?一文看懂国产开源大模型 DeepSeek 的功能、特点与使用方法

    DeepSeek),凭借三款产品迅速出圈: DeepSeek-Coder:性能超越 CodeLlama-34B 的开源代码大模型; DeepSeek-MoE:以稀疏激活实现“小成本、大性能”的混合专家模型; DeepSeek-VL

    5.2K40编辑于 2026-03-27
  • 来自专栏大模型系列

    DeepSeek 的开源策略对行业有何影响?——万字深度解析DeepSeek之全栈开源、免费商用、极致性能

    1.1“全栈开源”:不止于模型权重与部分厂商仅开源模型权重不同,DeepSeek奉行真正意义上的全栈开源:模型权重:从DeepSeek-LLM、DeepSeek-Coder到DeepSeek-MoE、DeepSeek-VL

    63120编辑于 2026-04-05
领券