首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI技术探索和应用

    文档和图片的OCR解析实践

    文档中的图片或图片本身的OCR识别可以通过第三方工具如PaddleOCR和CNOCR来实现,如下是两个识别过程的实践,以及使用Streamlit构建可视化页面的示例。 = CnOcr() img_path = 'books.jpg' img = read_img(img_path) res = ocr.ocr(img) for r in line['res']['html']}\n" print('file_content:', file_content) return file_content # 设置OpenAI API 凭证 openai.api_key = "sk-xxx" # 加载聊天记录 if "messages" not in st.session_state: st.session_state.messages ,我将传递给你一个文档内容,在下次交互时用户才会开始提问,你只需要回答是否明白。

    1.1K10编辑于 2024-03-13
  • Datalab Marker与OCR文档解析技术

    本文介绍了Datalab公司的Marker和OCR模型在文档解析与文本提取方面的技术应用。 OCR可从图像和文档中检测九十种语言的文本,并返回阅读顺序和表格网格。Marker模型基于开源项目Marker(某代码托管平台29k星标),OCR基于Surya(19k星标)。 元数据 },)print(output["markdown"][:400])运行OCRimport replicateoutput = replicate.run( "datalab-to/ocr 系统将PDF文档准确转换为Markdown格式并保留关键文本和结构信息的能力。 Marker在所有测试模型中表现优异,包括GPT-4o、Deepseek OCR、Mistral OCR和olmOCR。

    8410编辑于 2026-04-16
  • 来自专栏机器学习与统计学

    OCR 新纪元,超强文档解析 Skills 来了

    做过 RAG 的都知道,解析是第一道关,解析不好,后面再聪明也白搭——垃圾进,垃圾出 OCR文档解析相关我写过 N 多篇:DeepSeek-OCR、HunyuanOCR、PaddleOCR、GLM-OCR 、MinerU 等,横向对比了以上开源方案,从落地层面我最推荐的可能还是# RAG 必备,100 页 PDF 文档秒级精准解析! 、怎么路由 xparse-cli——Go 编写的跨平台二进制工具,底层调用 TextIn xParser API 整个工作流如下图: 用户说一句话 → Agent 自动识别是文档任务 → 触发 xparse-parse Skill → 调用 xparse-cli → 根据有无凭证自动走免费/付费 API → 返回 Markdown 或 JSON。 : 适合你用的场景: 用 Agent 做个人知识管理,原料里有大量 PDF/Word/PPT 搭建 RAG 知识库,需要高精度的文档结构化 日常工作要解析合同、财报、研报这类复杂文档 优缺点直说: 评价

    7810编辑于 2026-04-17
  • 数眼智能OCR文档解析API上线:免费使用!

    营业收入 | 15,280 | +12.5% || 净利润 | 2,150 | +8.3% |## 二、详细分析...为此,数眼智能正式推出新一代OCR文档解析API。 这意味着,学术文献可一键转为可搜索的知识库,发票合同能自动提取数据对接业务系统,复杂报告可即时变为可协作的在线文档。数眼智能OCR API正将沉睡的纸质信息转化为驱动业务增长的智能资产。 如何调用API只需简单几步,即可在数眼智能官网接入OCR文档解析API,或直接在线使用,将技术能力快速集成至您的业务流中。第一步:登录官网,获取密钥 访问数眼智能官网,注册并登录后,进入控制台。 第二步:查阅文档,集成调试在官网文档中心找到「文档OCR解析API」部分,这里提供了完整的接口说明、请求参数和返回示例,直接在线使用或根据自己的开发习惯,使用 Postman、cURL 或任何编程语言的 结语 数眼智能OCR文档解析API,凭借创新的“两阶段协同”架构与10秒内高效响应的核心优势,正成为企业处理非结构化信息的关键引擎。

    43611编辑于 2025-12-19
  • 来自专栏翩翩白衣少年

    PDF Extract APIOCR文档提取与解析工具,Python+自然语言实现

    PDF Extract API,是一款基于现代技术(Python+自然语言),专为文档提取与解析而设计的强大工具。 核心功能 1、高精度文档提取 PDF Extract API 利用先进的现代 OCR(光学字符识别)技术,能够准确提取任何 PDF 文档或图像中的文本内容。 2、个人识别信息(PII)匿名化 为了保护用户隐私,PDF Extract API 提供了匿名化功能,可以自动移除文档中的个人识别信息(PII)。 Redis 用于缓存 OCR 结果,进一步提升了性能,让用户能更快地获得处理结果。 结语 PDF Extract API 是一款功能强大且智能化的文档提取与解析工具,凭借其先进的 OCR 技术、精准的数据处理能力以及强大的后台支持,能够极大地提升文档管理的效率与安全性。

    1.4K10编辑于 2024-11-05
  • 来自专栏Java成神之路

    online_tool_01_ShowDoc_在线API文档工具

    ShowDoc:https://www.showdoc.cc/

    85420发布于 2018-08-10
  • 来自专栏自然语言处理

    EasyDoc文档解析API,实测体验分享

    其中有一个工具是EasyDoc,下面给大家分享一下EasyDoc文档解析API的使用以及解析效果 EasyDoc简介 EasyDoc的三大功能 内容块智能识别 基于语义智能识别内容块,精准提取完整知识单元 获取API密钥即可使用文档解析功能。 开始你的文档解析之旅! PDF解析:基于EasyDoc解析Arxiv论文 刚好自己在采集科研论文,下面是我用EasyDoc解析论文的一些效果,在这里分享给大家。 不过现在官方还不支持markdown内容生成渲染,后续会支持 Word解析:跨页表格识别 为了验证是否像官方介绍可以识别跨页表格,下面是简单制作了一个跨页word文档 解析的结果中有text文本以及 PPT解析:行业研究报告图表解析 在平时解析文档的过程中,我们会遇到ppt,其中ppt内容一般是图文并茂,传统的ppt解析方法只能解析文字,图片内容丢失比较多,下面是一个云计算行业报告: 解析命令如下 相关资源 EasyDoc官网:https://easydoc.sh/zh 完整API文档:https://github.com/easydoc-ai/easydoc 中文版快速上手指南:https://

    1.1K00编辑于 2025-04-19
  • Mistral OCR 3:以超高性价比实现SOTA文档解析

    Mistral OCR 3 技术评测:以商品级定价实现SOTA文档解析光学字符识别(OCR)技术的商品化历来是一场向低价看齐的竞赛,通常以牺牲结构保真度为代价。 这使得下游的智能体无需复杂的启发式解析器,就能原生地理解文档结构。基准对决:Mistral vs. Mistral OCR 3 是一个专门针对文档解析、表格重建和 Markdown 输出优化的模型。Pixtral Large 是一个通用多模态 LLM。 对于专门的文档任务,OCR 3 更小、更快、更便宜。如何使用 Mistral OCR 3 批处理 API 以降低成本?开发人员可以在发起 API 请求时指定批处理端点。 目前,Mistral OCR 3 是一个专有模型,仅可通过 Mistral API文档 AI 平台访问。

    27300编辑于 2026-02-08
  • 来自专栏MavenTalk

    一个非常适合IT团队的在线API文档、技术文档工具

    之前单独写过一篇文章《介绍几款常用的在线 API 管理工具》,今天又发现个不错的工具,推荐给大家。 ShowDoc 每当接手一个别人开发好的模块或者项目,看着那些没有写注释的代码,文档呢?!文档呢?! ShowDoc 是款适合 IT 团队的在线文档分享工具,可以让团队之间更高效的沟通。 ? 题图 from pixabay API 在线文档 APP、web 、Iot设备等前端与服务器常用 API 来进行交互. 方便快速地编写出美观的 API 文档,支持 MarkDown 语法. 提供在线、私有部署两种方式 www.showdoc.cc 提供安全稳定的在线文档托管服务. 你可以放心地选择托管你的文档数据在云端. 在线测试 API 提供RunApi功能支持 post/get 常用的 http 请求方式,可以添加 URL 请求参数,也可以自定义 header. 上几张截图,看看效果: ? ? ? ?

    2.3K20发布于 2020-02-14
  • 来自专栏秃头哥编程

    SpringBoot整合Swagger2,搭建Restful API在线文档

    世间上的相遇 都是久别重逢 Swagger是一个功能强大的在线API文档框架,目前它的版本是2.x,所以称为Swagger2。Swagger2提供了在线文档的查阅和测试功能。 3、生成文档的注解 Swagger2通过注解来生成API接口文档文档信息包括接口名、请求方法、参数、返回信息等。 通常情况下用于生成在线API文档,下面是常见的注解: @Api:修饰整个类,用于描述Controller。 @ApiOperation:描述类的方法,或者说一个接口。 API的说明,其中value值为该接口的名称,note为该接口的详细文档说明。 这样就可以让Swagger2生成在线API接口文档了,如果不需要某接口生成文档,只需要加上@ApiIgnore注解即可。

    81930发布于 2019-10-09
  • 来自专栏mall学习教程

    mall整合Swagger-UI实现在线API文档

    本文主要讲解mall是如何通过整合Swagger-UI来实现一份相当完善的在线API文档的。 项目使用框架介绍 Swagger-UI Swagger-UI是HTML, Javascript, CSS的一个集合,可以动态地根据注解生成在线API文档。 常用注解 @Api:用于修饰Controller类,生成Controller相关文档信息 @ApiOperation:用于修饰Controller类中的方法,生成接口方法相关文档信息 @ApiParam 文档的范围有三种不同的选择 生成指定包下面的类的API文档 生成有指定注解的类的API文档 生成有指定注解的方法的API文档 package com.macro.mall.tiny.config; import 直接在在线文档上面进行接口测试 ? ?

    1.4K30发布于 2019-07-22
  • 来自专栏软件测试学习

    一款适合IT团队的在线API文档、技术文档工具-showdoc介绍

    今天为大家推荐一款适合IT团队的在线API文档、技术文档工具,有免费开源和在线托管的版本。可以直接使用官网搭建好的地址,也可以在自己的服务器上搭建。 官网地址:https://www.showdoc.com.cn/ 具备以下特点: 1、可以方便快速编写出美观的API文档 2、用ShowDoc可以编辑出美观的数据字典 3、可以团队协作编写项目文档 4、可从代码注释中自动生成api文档,同时搭配RunApi客户端,可调试接口和自动生成文档 安装方法:服务器上搭建环境,现在我都倾向于用docker的方式,比较方便,不容易出错。 其实这个数据的同步都是利用showdoc本身的接口进行写入的,采用定时任务之后,要避免在对应的数据字典中去在线修改,可能会被定时同步给覆盖掉。 在github/gitee上也有不少自己用java代码写的解析swagger的json文件,然后调用api接口同步接口文档到showdoc的,感兴趣的小伙伴可以去试一试喔。

    4.5K20发布于 2021-03-08
  • 来自专栏DeepHub IMBA

    使用Python和OCR进行文档解析的完整代码演示

    在本文中将使用Python演示如何解析文档(如pdf)并提取文本,图形,表格等信息。 文档解析涉及检查文档中的数据并提取有用的信息。它可以通过自动化减少了大量的手工工作。 一种流行的解析策略是将文档转换为图像并使用计算机视觉进行识别。 在本文中我将展示如何使用OCR进行文档解析。我将展示一些有用的Python代码,这些代码可以很容易地用于其他类似的情况(只需复制、粘贴、运行),并提供完整的源代码下载。 将文档转换为图像(OCR):使用pdf2image进行转换,使用PyTesseract以及许多其他的库提取数据,或者只使用LayoutParser。 好的多 总结 本文是一个简单教程,演示了如何使用OCR进行文档解析

    2.3K20编辑于 2022-11-11
  • OCR文字识别 在线工具分享

    这个时候,直接用在线OCR文字识别工具会更省事。 在线工具网址:https://see-tool.com/ocr-text-recognition工具截图:我做的这款OCR文字识别工具,主要面向普通用户,适合处理截图、笔记、表单、图片资料等内容。

    11900编辑于 2026-04-15
  • 来自专栏技术开发——你我他

    Spring Boot整合Swagger2搭建Restful API在线文档

    Swagger2 通过注解来生成API 接口文档文档信息包括接口名、请求方法、参数、返回信息等。 通常’悄况下用于生成在线API 文档,以下的注解能够满足基本需求,注解及其描述如下。 口@Api : 修饰整个类,用于描述Controller 类。 API 的说明,其中value 值为该接口的名称,notes 值为该接口的详细文档说明。 这样就可以让Swagger2 生成在线API 接口文档了。 如果不需要某接扣生成文挡,只市要再加@Apilgnore 注解即可。 ; } } 1.启动服务,浏览器访问: http://localhost:8090/swagger-ui.html 查看在线API ?

    92070发布于 2020-06-08
  • 来自专栏用户9257747的专栏

    8 款在线 API 接口文档管理工具;好用!

    ,看群里面的小伙伴儿用了之后反馈都说挺好用的;那么趁热打铁,一起整理了8款在线文档管理工具,相信总有一款能合你的胃口; 目录 RAP Eolink EasyAPI Apizza EasyDoc ShowDoc ShowDoc 地址:https://www.showdoc.cc/ ShowDoc是一个非常适合IT团队的在线API文档、技术文档工具。 通过showdoc,你可以方便地使用markdown语法来书写出美观的API文档、数据字典文档、技术文档在线excel文档等等。 7.ApiFox https://www.apifox.cn ApiFox是一款API 文档API 调试、API Mock、API 自动化测试工具,这个工具主要是以客户端为主,不仅能高效测试,还能快速生成在线API文档

    46.8K52编辑于 2022-04-07
  • 来自专栏Web技术学苑

    前端如何在线Mock数据,并生成API接口文档

    开始第一个例子 在以前我们可以借助EazyMock[1]在线创建接口数据,在大多时候这是我们首选,简单,方便,并提供了非常好的mock接口工具,但是笔者想介绍另外一个比较好用的在线mock工具,apipost 当我们成功的用APIPOST模拟出与后台一样的类似接口时,一般后端都会给出接口文档,那么现在你可以像后端一样,按照后端要求,你可以在MOCK中完善你的MOCK接口文档 在APIPOST中提供了一份非常强大的自定生成接口文档功能 编辑以下,然后点击保存 我们点击分享 当我们复制打开这个链接时api/shoplist[3] 此时你会发现自动生成的文档结构非常的清晰,因此在项目中,你可以完全不依赖后端接口,并且可以引导后端接口的设计了 总结 我们使用apipost新建一个项目,新建了一个测试接口,并实时mock了一份在线数据 我们在实际页面中,测试了apipost新建的接口数据,并且成功响应 我们根据现有的接口,在线生成了一份MOCK 接口文档,我们通过MOCK可以很方便的看出哪些入参哪些出参,并且这份在线接口文档是可以实时保存的 本文示例code example[4] 参考资料 [1]EazyMock: https://mock.mengxuegu.com

    2.5K20编辑于 2023-09-20
  • 来自专栏WOLFRAM

    Wolfram 在线文档

    对于这么酷炫的产品,是不是如饥似渴,别急,我们有海量的免费在线帮助文档和源代码供您解渴: Wolfram 在线文档库(http://library.wolfram.com/) 收集了历年来 Wolfram Wolfram 在线视频库(http://www.wolfram.com/broadcast/) 手把手地教您使用 Wolfram 的各种产品,还有各种用户体验故事,不要错过...... 我们有丰富的在线中文帮助文档,帮助您进一步掌握了解 Wolfram 产品: 汉化的产品及功能介绍,各产业的解决方案(www.wolfram.com) 在线 Wolfram 语言与系统参考资料,含有5

    1.6K40发布于 2018-05-31
  • 来自专栏迁移内容

    SpringBoot实战:整合Swagger3实现在线Api文档

    Swagger-UI 是 HTML、Javascript、CSS 的一个集合,可以动态地根据注解生成在线 Api 文档;swagger-bootstrap-UI 则可以美化 swagger-ui,页面更清爽 本篇就是实现 SpringBoot 整合 Swagger3 实现在线 Api 文档Api 文档; swagger-bootstrap-UI:可以美化 swagger-ui,页面更清爽! //为有@Api注解的Controller生成API文档 // .apis(RequestHandlerSelectors.withClassAnnotation(Api.class API 文档信息 * * @return - */ @Bean public Docket api() { // 自动生成文档接口:http

    2K30编辑于 2022-12-11
  • 来自专栏夜梦星尘的折腾日记

    【docker】一个非常适合IT团队的在线API文档、技术文档工具 | showdoc

    前言 官网:ShowDoc ShowDoc是一款专为IT团队设计的在线API和技术文档工具。你可以使用Markdown语法编写API文档、数据字典、技术文档等。 ShowDoc还支持从程序注释自动生成API文档,或通过RunApi客户端边调试接口边生成文档。 用途: API文档:快速编写和发布API文档,方便客户端调用数据。 说明文档:编写工具说明书或技术规范文档,供团队查阅。 主要功能: 分享与导出:支持响应式设计,可将文档分享到各平台,或导出成Word文件。 自动化:从代码注释中自动生成文档,并可搭配RunApi客户端调试接口。 2. 准备 在开始部署之前,你需要安装 docker 和 docker-compose。 部署 官方的安装文档:Docker方式安装 原版官方镜像安装命令,新建文件夹: mkdir -p /root/data/docker_data/showdoc_data/html cd /root/data

    93110编辑于 2024-08-20
领券