首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Lcry个人博客

    利用 cloudstudio 免费 GPU 时长部署 DeepSeek-OCR

    就在上周,人工智能团队DeepSeek AI正式发布全新多模态模型 DeepSeek-OCR。 本文将带领大家部署在cloudstudio 利用免费时长的GPU资源部署一下带 web 端的项目,一睹为快。 解决什么问题? “一图胜千言”。 DeepSeek-OCR提出:为什么不干脆把这些长文本“截图”成一张图片,然后用Vision Encoder进行高效压缩,再喂给LLM呢? 一键部署项目开源项目地址 DeepSeek-OCR:https://github.com/deepseek-ai/DeepSeek-OCR DeepSeek-OCR-WebUI:https://github.com 要部署的现有 web 项目。

    34510编辑于 2026-01-09
  • 来自专栏机器学习与统计学

    DeepSeek-OCR桌面客户端,Windows用户优先体验

    部署 DeepSeek-OCR Client 目前主要针对 Windows 10/11操作系统进行了优化,并支持CUDA加速,这意味着拥有NVIDIA GPU 的用户将获得最佳性能。 其部署过程也力求简化: 系统环境: 需要 Node.js 18+ 和 Python 3.12+。 环境,部署和启动更为直接简单。 DeepSeek OCR App: 优势: 基于 Web 界面(React 前端+FastAPI 后端),支持 Docker 容器化部署,跨平台能力更强。 特点: 提供了更全面的 OCR 功能和更现代化的 Web 交互体验,但部署需要 Docker 环境,相对 DeepSeek-OCR Client 略显复杂。

    92410编辑于 2025-11-20
  • 再聊一聊deepseek-ocr的应用

    (GitHub[4]) 二、怎么部署官方模型? (GitHub[11]) 四、三款社区 WebUI 横评 下面我们对你给出的 3 个开源 WebUI 做一个“从部署门槛→功能点→适合谁”的系统对比。 (GitHub[20])•适合谁:•需要 Docker 化、一键部署,并希望能二次开发或接入企业网关/日志/鉴权体系的工程团队;•想要“可维护”的全栈脚手架,用来做内部服务或 SaaS 雏形。 一句话点评:工程化最好、部署最省心,上容器就能跑,还留足了二开的“地基”。 : Contexts Optical Compression:https://github.com/deepseek-ai/DeepSeek-OCR [11]GitHub - deepseek-ai/DeepSeek-OCR

    29110编辑于 2026-03-13
  • 复杂部署退退退!DeepSeek-OCR 轻量化文档理解,3分钟私有部署搞定

    在Lab4AI平台,你只需3分钟即可私有部署,让系统从识字工具跃升为“文档理解专家”。 论文名称:DeepSeek-OCR:ContextsOpticalCompression一键直达原文一键进行项目复现DeepSeek-OCR技术突破DeepSeek-OCR的颠覆之处,在于提出了一个全新思路 DeepSeek-OCR架构拆解DeepSeek-OCR的强大性能源于“压缩+解码”的精妙架构设计,两大核心模块各司其职、高效配合:1.DeepEncoder:双阶段视觉压缩引擎(AI光学压缩器)它负责把复杂文档图像 3分钟极速部署体验Lab4AI.cn上已上架了此篇论文的部署。 Step2模型部署参考官方文档完成模型部署,系统完成推理服务上线,跳转链接即可体验。Step3应用体验您可以可上传文档进行测试。本次实践支持从文字提取到表格解析再到图表与语义定位的全流程交互。

    59300编辑于 2025-12-03
  • DeepSeek-OCR vs PaddleOCR-VL

    多个技术博客与评测也复现了“10× 压缩 ≈ 96–97% 精度”这一经验数字,并给出了从部署到跑通示例的实践记录。 (Simon Willison’s Weblog[11]) 如何用好 PaddleOCR-VL? 1.任务定义:如果你要精确解析来自不同语言与复杂版式的 PDF/图片(含元素级结构化),优先考虑它。 (Hugging Face[12])2.资源与延迟:0.9B 规模+ 动态分辨率让它在边缘/轻量场景也能跑,满足工程部署与吞吐的实际诉求。 参考与延伸阅读 •DeepSeek-OCR 论文/解读与媒体报道:上下文光学压缩、10× 压缩≈97% 精度、组件(DeepEncoder + 3B-MoE)、实践记录与部署指南等。 utm_source=chatgpt.com [11]Getting DeepSeek-OCR working on an NVIDIA Spark via ...

    22410编辑于 2026-03-13
  • 来自专栏福大大架构师每日一题

    ollama v0.13.0 发布:DeepSeek-OCR、Cogito-V2.1 全新支持,性能工具 Bench 正式上线

    2025 年 11 月 19 日,Ollama 发布了 v0.13.0 版本,本次更新带来了多个重要的新特性与性能优化,包括全新的 DeepSeek-OCR 模型支持、Cogito-V2.1 模型上线、 DeepSeek-OCR DeepSeek-OCR 使用 光学二维映射 (optical 2D mapping) 技术压缩长上下文,在减少视觉 token 的同时,提升 OCR 精度,特别适合文档处理场景 the image." ollama run deepseek-ocr "/path/to/image\nFree OCR." ollama run deepseek-ocr "/path/to/image run deepseek-ocr "/path/to/image\n<|grounding|>Convert the document to markdown." 2. 对于需要高精度 OCR、跨模态输入、多环境部署的用户来说,这次更新值得关注与升级。 我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。

    63910编辑于 2025-12-19
  • 来自专栏机器学习与统计学

    【教程】DeepSeek-OCR本地部署(上):CUDA 升级12.9,vLLM升级至最新稳定版

    DeepSeek OCR,还有一个桌面客户端:DeepSeek-OCR 桌面客户端,Windows 用户优先体验 DeepSeek-OCR 官方项目 README: https://github.com 我看网上大家根据官方文档进行部署,问题多多。正好,vLLM 最新版来了,V0.11.2 稳定版原生支持 DeepSeek-OCR,使用 OpenAI API 兼容格式的在线推理,方便多了 。 的部署和 API 使用。 v0.11.2 拉取镜像 然后 docker save -o vllm012.tar vllm/vllm-openai:v0.11.2 把镜像保存到本地后传入内网服务器即可 至此 vLLM 升级完成 部署 DeepSeek-OCR 后面就是用 VLLM 的 Docker 拉起 DeepSeek-OCR 了 测试很 OK,单卡 4090 很顺畅,具体步骤就要下文了

    2K10编辑于 2025-11-29
  • 来自专栏菲宇

    docker上部署odoo11

    run -d -e POSTGRES_USER=odoo -e POSTGRES_PASSWORD=odoo --name db postgres:9.4 二、安装odoo 1、拉取一个odoo:11 的镜像 docker pull odoo:11 2、制作并运行一个odoo容器,端口映射一个端口。 docker run -p 8069:8069 --name odoo --link db:postgres -t odoo:11 注意:db不能修改,否则odoo运行时会报错。

    1.4K10编辑于 2022-12-21
  • 来自专栏用户中心项目

    DAY-11-项目部署

    部署 1.多环境:指同一套项目代码在不同的阶段根据实际情况来调整配置部署到不同的机器上 lombok在编译时已经写好了 why: 每个环境互不影响; 区分不同的阶段:开发/测试/生产 对项目进行优化: Dmaven.test.skip=true" 拖到虚拟机里 chmod a+x user-center-backend-0.0.1-SNAPSHOT.jar(a+x,给所有文件可执行权限) 创建表的语句时建议保存起来 2.项目部署上线 原始前端后端项目 宝塔Linux 容器(把原本部署在服务器上的东西封装成更轻量的应用在服务器上运行) 容器平台 项目部署 需要Linux服务器(建议用Centos8+/7.6以上) 前端:需要web

    19500编辑于 2025-10-23
  • 当开源 OCR 革命撞上多模态成本困局:我们如何用 Gateone.ai 把 DeepSeek-OCR 变成“印钞机”

    突然开源了 DeepSeek-OCR——一个能将任意 PDF 或图像一键转为结构化 Markdown 的视觉语言模型。 一、开源 OCR 的“甜蜜陷阱”我们第一时间接入 DeepSeek-OCR,却发现理想与现实之间隔着三座大山:1.部署即深渊虽然官方提供了 Transformers 和 vLLM 两种推理方式,但要在生产环境同时支持高分辨率扫描件 Vision(低延迟优先)部署复杂度下降 80%,工程师终于不用再写“模型适配器”了。 我们将同一份财报分别输入三个模型,系统自动输出:· 表格还原准确率(DeepSeek-OCR:92% vs GPT-4o:85%)· Markdown 结构完整性(DeepSeek-OCR 胜出)· 单页处理成本 如果你也拥有一个惊艳的开源模型,却困于部署、调度与成本的泥潭——是时候让它接入真正的 AI 中枢了。

    31410编辑于 2025-10-24
  • deepseek-ocr及其他ocr模型衍生应用的思考

    部署和使用的。 因为,我找到了更好的后端部署管理的方式。 后端部署管理 deepseek-ocr.rs Rust 实现的 DeepSeek-OCR 推理栈,提供快速 CLI 与 OpenAI 兼容的 HTTP Server,统一打包多种 OCR 后端、视觉输入预处理 官方 DeepSeek-OCR 依赖 Python + Transformers,部署体积大、依赖多,嵌入原生系统成本高。 paddleocr-vl-q6k paddleocr-vl Q6_K 通用推荐,适合绝大多数工程部署

    28110编辑于 2026-03-13
  • 来自专栏AgenticAI

    刚刚DeepSeek开源新模型DeepSeek-OCR

    就在3个小时前,DeepSeek突然在HuggingFace上传新模型DeepSeek-OCR,一个只有3B大小的文档解析新模型,该模型的目标是探索视觉文本压缩的边界。 在生产环境中,DeepSeek-OCR能够以单个A100-40G GPU的计算能力,每天生成 200k+ 页的训练数据,供大语言模型或视觉语言模型使用。 其在Fox benchmarkd 目前可用vllm和transfomer部署,然后就像正常的文档解析模型一样。 模型地址:https://huggingface.co/deepseek-ai/DeepSeek-OCR

    38210编辑于 2025-11-29
  • 来自专栏机器学习与统计学

    撸了一个 OCR 大模型对比工具:DeepSeekOCR、PaddleOCR 和 混元OCR

    大家好,我是 Ai 学习的老章 最近的 OCR 大模型我都做了本地部署和测试,还写了一个 API 统一对接这三个模型 ✅腾讯混元 OCR 大模型,本地部署,实测 ✅本地部署 PaddleOCR,消费级显卡轻松跑 ,支持本地图片和 PDF 文件 ✅DeepSeek-OCR 本地部署(上):CUDA 升级 12.9,vLLM 升级至最新稳定版✅DeepSeek-OCR 本地部署(下):vLLM 离线推理,API 重写 也可以切换到识别后的原始 Markdown,支持一键 copy 核心代码如下(完整代码接近 600 行,大多是 HTML 相关): 我这里主要是模型本地部署,内网运行的,没再折腾线上部署。 感兴趣的同学可以试试,OCR 模型 API 部分替换成官方/第三方的 API,代码稍作修改就可以在线部署运行了。 #! ": "http://localhost:8002/models/v1//deepseek-ocr/inference", "PaddleOCR": "http://localhost:8003

    1.2K10编辑于 2025-12-21
  • 只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。

    因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。 然后在我上一篇讲DeepSeek-OCR文章的评论区里,有很多朋友都在把DeepSeek-OCR跟PaddleOCR-VL做对比,也有很多人都在问,能不能再解读一下百度那个OCR模型(也就是PaddleOCR-VL 而且实测确实会比DeepSeek-OCR准确更高,DeepSeek-OCR提取的时候总是会错一两个字,PaddleOCR-VL是一字不错,当然你不能把DeepSeek-OCR纯看成是一个纯OCR模型,毕竟意义还是不太一样 PaddleOCR Github上的部署教程来部署到本地。 只是想用一下的,不想折腾部署的,可以去各大demo平台上用官方自己部署的体验版本。

    98020编辑于 2025-11-18
  • 牛逼,DeepSeek-OCR 最新免费,引爆文档处理效率的黑科技模型

    DeepSeek-OCR:Contexts Optical Compression。探索视觉-文本压缩的边界。” 开源可部署开源代码 + 模型权重,MIT 许可证。可自建、自控、安全可审。 开源部署能力模型权重、代码、文档公开,自建部署支持安全与定制。 与同类项目对比及产品优势项目识别结构化能力长文档/批量处理输出格式开源&可部署优势总结DeepSeek-OCR强(支持标题、表格、图注)很强(文档压缩+批量)Markdown/文本✅最佳结构化输出+可部署 开源自部署:适合企业、机构构建私有化流程,降低 SaaS 风险。输出格式友好:Markdown 输出方便编辑、检索、二次加工。

    2.1K30编辑于 2025-10-29
  • 金融财报 + 科研论文双场景实测:DeepSeek-OCR 让数据处理效率翻 6 倍

    上周同时接手两家客户的开发需求:头部券商要 “年报智能分析系统”,高校实验室需 “论文公式结构化工具”,本以为要适配两款 OCR 工具,试了 DeepSeek-OCR 后发现 —— 这3B参数的小模型竟能通吃两大领域 一、两大领域精准 “踩点”,DeepSeek-OCR 的核心优势藏在细节里​这款以 “视觉压缩” 为核心的模型,并非简单提升识别精度,而是精准解决了金融与科研教育场景的痛点难题:​1. 轻量化部署 + 多语言支持,适配场景更灵活​两大领域的落地都绕不开 “部署成本”:券商的分支机构服务器多为 8G 内存配置,高校实验室需处理多语言外文文献。 DeepSeek-OCR 在单张 A100 GPU 上仅占 4.5GB 显存,8G 内存的边缘设备也能流畅运行,批量处理 500 页文档仅需 1 小时。 不用再为密钥管理耗费精力,不用为接口适配写冗余代码,让技术人员能聚焦在 “如何用 DeepSeek-OCR 提升识别精度”“如何优化数据分析逻辑” 这些核心问题上。

    63620编辑于 2025-10-23
  • 来自专栏技术专栏全家桶

    大模型之DeepSeek-OCR2快速入门实战教程

    DeepSeek团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文,并开源DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分 DeepSeek-OCR 不仅继承了传统OCR的文本识别能力,更在“文档理解”层面进行了全方位升级。 04、DeepSeek-OCR本地部署与环境搭建 可从Hugging Face或魔搭社区(ModelScope)获取。 Convert to structured JSON. 10.批量处理模板 适用于批量OCR任务: <image>\nProcess all text with layout preservation. 11 DeepSeek-OCR实际应用效果

    2.3K10编辑于 2026-02-03
  • 来自专栏开源部署

    如何在Ubuntu 18.04上部署Odoo 11

    =/opt/odoo/odoo11-venv/bin/python3 /opt/odoo/odoo11/odoo-bin -c /etc/odoo11.conf StandardOutput=journal 您可以使用以下命令检查服务状态: sudo systemctl status odoo11 输出: ● odoo11.service - Odoo11   Loaded: loaded (/etc/systemd .service           └─18351 /opt/odoo/odoo11-venv/bin/python3 /opt/odoo/odoo11/odoo-bin -c /etc/odoo11 为了使我们的Odoo部署最安全,我们将Nginx配置为一个SSL终止代理,它将通过HTTPS提供流量。 SSL终止代理是处理SSL加密/解密的代理服务器。 对于生产部署,建议切换到多处理服务器,因为它可以提��稳定性并更好地使用系统资源。 为了启用多处理,我们需要编辑Odoo配置并设置非零数量的工作进程。

    2.7K20编辑于 2022-07-13
  • SAM+CLIP+MoE完美耦合的DeepSeek-OCR:DeepEncoder的低激活压缩架构深度解析

    DeepSeek-OCR论文提出了一种创新的视角,将视觉模态视作一种高效的文本压缩介质。 这不仅是实验的需要,更是工程部署的考量。这些模式允许模型根据输入图像的复杂度和文本密度动态调整Vision Tokens的数量。 实用性能与生产力释放在OmniDocBench真实文档解析任务上,DeepSeek-OCR展现出超越现有先进模型的实用能力:Token效率领先: DeepSeek-OCR使用最少的Vision Tokens DeepSeek-OCR所提供的近乎无损的超高压缩比,正是解决这些问题的关键工程实践路径之一。 DeepSeek-OCR不仅模型,更是一种能效优化策略。市场对高能效AI基础设施的需求日益增长,这种技术直接提升了AI服务的单位成本效益,在云计算和私有部署市场中具有重要的商业价值。

    48910编辑于 2025-11-03
  • 来自专栏超详细二进制部署k8s系列[19]篇

    二进制部署k8s教程11 - 部署kubelet

    TIP二进制部署 k8s - 部署 kubelet 手动颁发证书方式***转载请注明出处:https://janrs.com/24e1有任何问题欢迎在底部评论区发言。部署 kubelet! NOTE部署 kubelet 之前需要初始化系统环境。在 node 节点上,kubelet 是需要对外提供服务的。在 k8s 中,调用 kubelet 服务的也只有 kube-apiserver。 NOTE这里部署的 node 节点的 ip 地址为:172.16.222.231。生成的 server 证书只针对该服务器生成。 ,有可能需要删除已经生成的工作数据rm -rvf /var/lib/kubelet/*11.检测到 master 服务器查看节点是否加入kubectl get nodes显示NAME STATUS 后面再部署网络插件。***至此。node 节点的 kubelet 部署成功。转载请注明出处:https://janrs.com/24e1有任何问题欢迎在底部评论区发言。

    1.2K10编辑于 2023-03-08
领券