腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
有没有一种方法可以使用Perl在
PDF
的特定
区域
内进行文本搜索?
我有由PDFcreator创建的
PDF
。每个多页
PDF
的第一页都有需要
识别
的邮寄地址。有没有办法在
PDF
的特定
区域
内进行文本搜索? 我已经找到了和,但看不到将搜索限制在特定
区域
的方法。我主要关心的是准确性,因为在同一个
PDF
中可能会出现不同的地址。另外,搜索整个
PDF
可能太慢了。
浏览 5
修改于2017-05-23
得票数 0
1
回答
如何使用Java从
PDF
中的特定矩形
区域
提取数据?
我试图从
PDF
中给定的两个坐标指定的特定矩形
区域
中提取数据。是否可以在
PDF
中执行此操作,或者我是否必须将其转换为图像并使用OCR?如果有,PDFBox或iText是否包含通过光学字符
识别
来分析图像的方法?谢谢!
浏览 26
提问于2017-12-26
得票数 3
回答已采纳
1
回答
从扫描的文档中提取数据c#
我有一个
PDF
文件,其中包含我们需要导入到数据库中的数据。该文件是打印文本的
pdf
扫描。数据的结构如下Date : 01/12/2014但这些数据并不总是出现在document.So的相同
区域
中,我需要一个可以
识别
这些文件的工具或应用程序接口。
浏览 2
提问于2015-01-21
得票数 0
1
回答
用Java/Kotlin文件检测unicode专用
区域
(PUA)字符
是否有正确的方法来
识别
Java/Kotlin中的Unicode私有使用
区域
(PUA)字符? 一些背景,我们正在使用
PDF
转换工具,它不支持PUA字符。因此,我们需要标识文件中可用的任何PUA字符。
浏览 4
提问于2022-04-20
得票数 1
3
回答
PDF
数据提取-需要建议
我创建了一个
pdf
提取工具。样品屏幕附加。 现在的问题是,有时在一些pdfs中,提取所需的部分数据被转移到下一页。(移动的原因是;我将给出一个示例。因此,现在我考虑的是,
识别
pdf
的结构,而不是获取坐标.。 但我没有明确的想法去做。请分享任何东西,你认为这对解决这个问题有帮助。我再次重申,我正试图从
pd
浏览 1
修改于2015-11-12
得票数 2
回答已采纳
1
回答
如何
识别
哪些剪辑路径应用于路径或填写
PDF
矢量图形?
虽然我能够提取剪辑路径定义本身,但我无法确定哪些定义适用于正常的笔画或填充
区域
。例如,请参考获取从
PDF
页面中提取的SVG,以及在提取过程中看到的
PDF
图形命令序列的相应转储。从SVG中可以看出,有多个剪辑路径和一个矩形填充
区域
。尽管在定义填充矩形之前定义了多个剪辑路径,但只有在之前定义的圆形剪辑路径矩形定义将与矩形相关联(根据
PDF
页面在各种
PDF
阅读器上的呈现方式,在白色背景中只显示2个填充的圆圈)。问题是如何知道哪些剪辑路径与
PDF
中定义的规则填充/笔画
浏览 2
提问于2013-06-08
得票数 2
回答已采纳
1
回答
如何使用wkhtmltopdf在
pdf
页脚中创建可单击链接?
我们希望使用
pdf
页脚的链接。我们利用wkhtmltopdf工具生成我们的pdfs。
浏览 7
提问于2022-11-09
得票数 0
回答已采纳
1
回答
用iTextSharp使用.Net解析
PDF
形状对象
我正试图解析一堆
PDF
格式,它们有一段看起来是文本,但实际上只是一堆看起来像文本的嵌入形状,所以使用iTextSharp中的普通iTextSharp对象提取“文本”是不可能的。由于我试图提取的文本是仅有的10个可能的单词之一,而不是实际上“阅读”这个单词(或者更确切地说,‘以一个单词的形式’形状‘),我想我可以通过与我已经
识别
的其他单词进行比较来确定这个单词是什么。我的第一个问题是,我怎样才能到达
PDF
的这一部分?如何使用iText解析文档以深入到此形状对象?在我所有的文档中都有一个常见的词开始这个部分,所以我想我可以用它作为一个地标来知道
浏览 3
修改于2011-09-09
得票数 1
2
回答
Java中
PDF
文本提取
我有一个用iText生成的
PDF
文件,它是用JasperReports创建的(我不知道它是否相关),我想知道是否可以找到一些API或任何东西来查看结构,因为我需要从中提取文本。如果我试图以DOCX的形式打开它,我会看到这个词可以
识别
某种结构,例如,在DOCX中转换后,一个看起来像
PDF
中的表的
区域
实际上是一个表。 我需要了解
PDF
是如何创建的,如果这是可能的话。我知道使用
PDF
格式并不容易,但我需要从一些有用的东西开始。谢谢!
浏览 1
修改于2018-07-11
得票数 1
1
回答
禁用输入字段中Unicode字符的范围
我有一个用于纯文本的文本
区域
,用户有时可以复制和粘贴特殊字符。当使用表情符号时,它就成了一个问题,因为它是我们需要包含在
PDF
文件中的材料。例如:❤️现在我的问题是,在验证表单时,我如何
识别
这些字符并用Javascript删除它们呢?我不想限制太多,因为很多语言(俄语,阿拉伯语等等)都是被允许的。
浏览 0
提问于2014-11-10
得票数 0
回答已采纳
1
回答
Camelot
PDF
维数
我想做的事: 我使用Camelot来
识别
表(很明显)。有时,当我知道页面中可能包含感兴趣表的
区域
时,我只想在该
区域
中搜索。使用camelot.read_
pdf
()的table_region kwarg很容易做到这一点--我只需要为Camelot提供一对搜索坐标。被检测到的最小行的大小是通过将
PDF
页面的维度除以称为line_scale的缩放因子来计算的。默认情况下,它的值为15。”我对其他选项开放,基本上我想检查页面的某个
区域
是否包含一个表(在PyMuPDF坐标系中描述的
区域</
浏览 1
提问于2019-12-03
得票数 4
1
回答
用PDFBox验证电子签名
我的公司要求一个从
PDF
表单中提取数据的Java服务实现,以便直接启动使用Apache PDFBox的客户端操作的处理功能。很简单。我有几个选择: 如果可能的话,对数字签名表单字段进行修改,以接受电子签名,如果可能的话。我有一个小小的解决办法,使用Acrobat的最新版本,将图像表单字段放在签名
区域
,这非常好,除了一件事:我尝试过的所有软件都将这个表单字段类型读取为一个按钮。是否有任何方法强迫它
识别
图像,或任何
PDF
读取软件是更最新的
浏览 5
提问于2018-01-11
得票数 0
回答已采纳
1
回答
改进zbarimg qrcode
识别
我有一个扫描纸张的工作系统,然后让zbarimg
识别
这些纸张上的qrcode (虽然我不知道qrcode出现在哪个
区域
)。突然间,qrcode
识别
变得更加糟糕,最终完全停止了工作。物理扫描仪从扫描的纸张生成
PDF
。我使用鬼怪脚本将其转换为图片:当您尝试用智能手机读取qrco
浏览 0
提问于2021-10-23
得票数 0
回答已采纳
1
回答
如何使用python
识别
pdf
中的图形?
新的
pdf
解析。输入-
pdf
与一个图形,如这一个。输出应为-真或假也许还有别的办法? 谢谢!
浏览 5
提问于2022-11-17
得票数 0
1
回答
Ghost脚本更改输入
pdf
的尺寸
我正在使用gs 9.20,并试图从
pdf
文件中使用以下命令生成eps文件。内容
区域
(灰色)之外的
区域
是空白
区域
。
PDF
:这里的尺寸以点为单位(来自Adobe Illustrator的屏幕截图)EPS:这里的尺寸以点为单位(来自Adobe Illustrator的屏幕截图) 下面是pdfinfo -box命令对
pdf
文件
浏览 2
修改于2017-03-24
得票数 0
1
回答
将模型属性传递给Django中的URL
我有一个模型,它有两个字段,名为id (as pk)和region,我有一个页面来返回每个region.There中的对象,它们是10个
区域
,我需要将
区域
号传递给url,以便从db筛选该
区域
检索数据。这是我的代码:def render_
pdf
_view(request, *args, **kwargs):context = {'data
浏览 5
提问于2020-10-20
得票数 1
1
回答
有没有办法用
pdf
.js为
pdf
呈现编写javascript事件?
我有一个场景,要求我制作在线
PDF
查看器,在查看模式下,用户将选择
PDF
的某些
区域
,并在选择标记
区域
边界w.rs.tpdf时将其发送到服务器。示例如果用户单击在日期创建的
区域
,则应将所选
区域
的边界发送给服务器。问候
浏览 1
修改于2013-01-22
得票数 3
1
回答
如何在CoSign Signature SOAP API中更改签名的坐标,并将其放在给定的文本上(即在此处签名)?
我的
pdf
文件将有一个带有文本"Sign here“的
区域
。它可以在
pdf
中的任何位置(即该
区域
的坐标未定义)。我想在我的
pdf
文件中添加在给定
区域
或文本上的签名(例如“在此签名”)。
浏览 5
提问于2014-06-30
得票数 1
1
回答
在PHP中标识
PDF
/A文件
我正在尝试
识别
PDF
文件是否为
PDF
/A文件。使用poppler-php,我能够读取元数据,但没有迹象表明它是
PDF
/A文件。 我的目标是通过添加数据来编辑
PDF
。
PDF
/A似乎是只读的(因为它们是为存档而设计的,这并不奇怪)。我想要
识别
他们,以便提前拒绝他们。 致以敬意,
浏览 9
提问于2020-09-07
得票数 1
回答已采纳
4
回答
利用Tabula从
PDF
中提取表
不幸的是,在第一页上有很多无用的
区域
,我不想让Tabula提取。根据文档,您可以指定要从中提取的页面
区域
。然而,无用的
区域
只是在我的
PDF
文件的第一页,因此,对于所有后续的页面,Tabula将错过顶部部分。是否有方法指定
区域
条件仅适用于
PDF
的第一页?from tabula import read_
pdf
df = read_
pdf
(r"C:\Users\riley\Desktop\Bank Statements\50340.
pdf
浏览 1
修改于2017-03-02
得票数 2
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券