腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
2
回答
使用R
识别
PDF
表格
我正在尝试从一些
pdf
报告中的表中提取数据。 我已经看到一些使用pdftools和类似包的示例,我成功地获得了文本,但是,我只想提取表。 有没有一种方法可以使用R来
识别
和提取仅表?
浏览 36
修改于2017-05-24
得票数 23
2
回答
如何
识别
pdf
文件中的
表格
我想要
识别
一个
pdf
文件中的
表格
。在C#中使用了什么SDK来
识别
pdf
中的表,以及一些逐个单元格读取的机制,有人能推荐一下吗?
浏览 1
修改于2017-05-06
得票数 1
回答已采纳
2
回答
使用Azure表单
识别
器提取
PDF
表格
数据
我正在工作的发票处理项目使用Azure从
识别
器。所有发票都是
PDF
格式的。我正在使用一个自定义的表单
识别
器与标签。我可以从
PDF
中提取一些数据,如发票编号、发票日期、金额等,但我想使用Azure表单
识别
器从
pdf
中提取
表格
数据,但它没有正确读取表。是否有办法使用Azure表单
识别
器正确地从
PDF
中提取表数据? 扫描表是我们的应用程序的基本要求,它将决定我们是否使用Azure表单
识别
器作为应用程序的基础。请查看下面的<
浏览 10
修改于2020-09-15
得票数 0
2
回答
使用java从
pdf
中
识别
和提取
表格
我有不同类型的
pdf
,其中包含多个东西,如文字,
表格
等。该表可能存在任何地方的
pdf
(顶部,中部,底部)。我只想提取表数据(否)。列上的,不。在不传递位置的情况下使用java从
pdf
中提取行和表中的数据。 有人
浏览 12
修改于2017-05-23
得票数 1
1
回答
如何用java
识别
pdf
文件中的
表格
、图片和列表?
如何
识别
表格
、图像、列表等。使用java程序。我使用的模块是PDFbox,如果有任何想法进一步处理...,
浏览 1
提问于2014-09-29
得票数 0
1
回答
非
PDF
格式文件中可填入
PDF
表格
的正面
识别
我正在寻找一种编程方法,以积极
识别
非
PDF
表单文件中的可填充
PDF
表单。我认为可供选择的办法如下: 用支持十六进制的语言(如Python )解析文件以进行签名标识。
浏览 5
修改于2013-07-23
得票数 0
1
回答
如何使用python
识别
pdf
中的图形?
新的
pdf
解析。输入-
pdf
与一个图形,如这一个。输出应为-真或假也许还有别的办法? 谢谢!
浏览 5
提问于2022-11-17
得票数 0
1
回答
我想阅读带有图像、文本和
表格
的
PDF
内容
我是一个非常新的阅读
PDF
内容与图像,文本和
表格
。现在,我想要实现的是我想从
PDF
中读取包含文本、图像和
表格
的内容,并将其转换为HTML。我知道
识别
图像和
表格
是很困难的。对于图像-我不想从
PDF
中提取图像,因为我要为图像保留一些占位符,以便我可以给出一些替代文本。如果存在图像,是否可以在读取
PDF
内容时
识别
图像?对于
表格
-我想阅读
表格
,因为它是如何在
PDF
中出现的。 所有这些转换都
浏览 2
提问于2019-01-04
得票数 0
1
回答
表未被
识别
import pandas as pdFileName="Filepath"print DF3 import camelottables = camelot.read_
pdf
(FileName,pages='1-end') print t
浏览 10
修改于2019-02-28
得票数 0
2
回答
识别
已提交的网页网址以供联络
表格
7
我目前正在使用一个单一的形式通过联系
表格
7的访问者下载我的网站上的
pdf
文件。一旦他们填写
表格
并点击提交按钮,相关的
pdf
文件将被下载。但是,我想导出有关访问者的信息,无论谁下载了特定页面的
pdf
文件。我从联系
表格
DB下载了报告,但是它没有显示访问者提交表单的任何链接或页面名称。我相信有一种方法可以
识别
或解决这个问题。 谢谢
浏览 4
提问于2017-08-15
得票数 1
回答已采纳
1
回答
用c#编程编辑
PDF
(非固定
PDF
)
是否可以编辑在C#中不可填充的
PDF
格式 所需经费: 必须编辑以编程方式填写的
表格
中的文本和数据,并保存它。
浏览 6
修改于2012-06-28
得票数 1
1
回答
如何使用python从
PDF
中提取文本、
表格
和图像
我有一个
PDF
文件,其中包括文本,图像和
表格
。如何提取3,使其能够
识别
要提取的内容,并自行完成提取?
浏览 12
提问于2020-04-03
得票数 0
1
回答
Tabula-py不能
识别
正确的列
我正在尝试使用
表格
来
识别
pdf
文档。我使用以下代码:但是,在
识别
之后,前两列是单列。
浏览 9
提问于2021-06-10
得票数 0
2
回答
PDF
表格
数据
我有一个关于从
pdf
文件中提取文本,准确地说是
表格
数据的一般问题。我为我的一堆
pdf
文件解决了这个问题,方法是重新展开文本(顺便说一下。
pdf
查看器为单元格绘制线条,并知道单元格的开始和结束位置,但我们无法从
pdf
浏览 2
提问于2012-12-22
得票数 2
1
回答
如何在ITextSharp 4中使用css和样式表?
我正在导出一个html视图到
pdf
,我怎样才能让它
识别
css样式?主要是颜色,
表格
边框,字体大小,没有什么太忙乱的。
浏览 3
提问于2011-08-05
得票数 0
1
回答
如何在
PDF
文件中找到
表格
网格线?
为了更准确地提取表单元格中嵌入的类似
表格
的数据,我希望能够
识别
PDF
中的表单元格边界,如下所示:我已经尝试使用Camelot、pdfplumber和PyMuPDF来提取这样的表,并取得了不同程度的成功但由于我们收到的
PDF
格式不一致,即使在指定
表格
边界时,我也无法可靠地获得准确的结果。 我发现,如果我通过显式指定单元格边界来单独提取每个
表格
单元格,结果会更好。我的挑战是如何以编程方式
识别
表格
单元格边界,因为
表格
可以从页面上
浏览 12
修改于2021-03-04
得票数 0
4
回答
将Excel电子
表格
另存为
PDF
我正在尝试使用Visual Basic将Excel电子
表格
另存为
PDF
文件。我在网上找到了一些示例代码(见下文),但它让我打开了一个Visual Basic似乎不再
识别
的Workbook对象。建议..Dim workbook As New Workbook() pdfDocume
浏览 1
修改于2015-09-24
得票数 2
1
回答
如何在Abby Finereader中从用户字典创建连字?
我需要从扫描的文档(
pdf
)中
识别
复杂的化学名称。它们包含特殊字符,并以
表格
格式写入。我还有一个Excel文档,其中包含我在扫描过程中可能遇到的所有可能的名称(我认为是行,因为没有组合)。有没有办法创建连字(这样Finereader就可以
识别
整行,而不是把它分解成单独的字符)?我尝试创建用户字典,但Finereader没有将其视为一行。
浏览 3
提问于2017-05-02
得票数 0
1
回答
找不到'w2_‘类型的文档,找到1种其他文档类型- Google文档AI
我使用GoogleDocumentA.I来
识别
不同类型的
表格
,如美国政府
表格
、W2
表格
、W9
表格
、发票
表格
、收据
表格
。document typesUnable to find a document of type 'w9_', found 1 other document typesconst dow
浏览 2
修改于2021-08-18
得票数 0
1
回答
从
pdf
里?
我只想从一个“富”
pdf
文档中提取核心文本,这意味着它有很多我不感兴趣的
表格
、图表、框、页脚等等。我尝试使用一些常见的python包,如PyPDF2、pdfplumber或pdfreader.The,显然它们提取了
pdf
中所有的文本,包括上面列出的那些我不感兴趣的部分。file = PdfReader(file)text = page.extract_text() 这段代码将为我从第11页获得整个文本,包括页脚、框、
表格
中的文本和页面的编号是否有任何方法/包可以自动
浏览 11
修改于2022-11-07
得票数 -1
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券