腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
有没有一种方法可以使用Perl在
PDF
的特定
区域
内进行文本搜索?
我有由PDFcreator创建的
PDF
。每个多页
PDF
的第一页都有需要
识别
的邮寄地址。有没有办法在
PDF
的特定
区域
内进行文本搜索? 我已经找到了和,但看不到将搜索限制在特定
区域
的方法。我主要关心的是准确性,因为在同一个
PDF
中可能会出现不同的地址。另外,搜索整个
PDF
可能太慢了。
浏览 5
修改于2017-05-23
得票数 0
1
回答
如何使用Java从
PDF
中的特定矩形
区域
提取数据?
我试图从
PDF
中给定的两个坐标指定的特定矩形
区域
中提取数据。是否可以在
PDF
中执行此操作,或者我是否必须将其转换为图像并使用OCR?如果有,PDFBox或iText是否包含通过光学字符
识别
来分析图像的方法?谢谢!
浏览 26
提问于2017-12-26
得票数 3
回答已采纳
1
回答
SciPy stats Gamma
PDF
-无法成功地对
PDF
曲线下的
区域
进行着色
我一直在尝试使用多边形补丁对Gamma分布
PDF
下的
区域
进行着色,但无论我做什么,着色
区域
都不会与
PDF
的曲线对齐。多边形顶点是从相同的gamma
pdf
函数直接生成的。这里发生什么事情?(1,1, figsize=(20,10)) y = gamma.
pdf
(x, a=
9
, scale = 0.5) #alpha=<
浏览 22
修改于2020-03-04
得票数 1
1
回答
从扫描的文档中提取数据c#
我有一个
PDF
文件,其中包含我们需要导入到数据库中的数据。该文件是打印文本的
pdf
扫描。数据的结构如下Date : 01/12/2014但这些数据并不总是出现在document.So的相同
区域
中,我需要一个可以
识别
这些文件的工具或应用程序接口。
浏览 2
提问于2015-01-21
得票数 0
1
回答
PHP FPDF更改字体大小仅限于
我已将所有
pdf
的字体大小设置为10,问题是如果我想更改
pdf
的特定
区域
的字体大小而不更改所有的字体大小,可以吗?参见下面的代码,我想改变这些
区域
的字体大小$
pdf
->SetXY(17,80); <?php $
pdf
->addPage('P', 'Legal') ; $
浏览 28
提问于2021-01-30
得票数 0
回答已采纳
1
回答
如何
识别
字符串中的字符?
我正在尝试编写一个Powershell代码,以便从多个文件的文件名中
识别
具有特定字符的字符串。文件名示例$Variable = $Filename.Substring(15,
9
)但是,在某些情况下,文件名如下所示$Variable = $Filename.Substring(15,
9</
浏览 0
提问于2020-02-06
得票数 1
回答已采纳
1
回答
用Java/Kotlin文件检测unicode专用
区域
(PUA)字符
是否有正确的方法来
识别
Java/Kotlin中的Unicode私有使用
区域
(PUA)字符? 一些背景,我们正在使用
PDF
转换工具,它不支持PUA字符。因此,我们需要标识文件中可用的任何PUA字符。
浏览 4
提问于2022-04-20
得票数 1
3
回答
PDF
数据提取-需要建议
我创建了一个
pdf
提取工具。样品屏幕附加。 现在的问题是,有时在一些pdfs中,提取所需的部分数据被转移到下一页。(移动的原因是;我将给出一个示例。因此,现在我考虑的是,
识别
pdf
的结构,而不是获取坐标.。 但我没有明确的想法去做。请分享任何东西,你认为这对解决这个问题有帮助。我再次重申,我正试图从
pd
浏览 1
修改于2015-11-12
得票数 2
回答已采纳
4
回答
用于查找
PDF
文件的Java正则表达式
需要帮助找出如何调整下面的正则表达式现在文件名已经改成了新的格式,我不知道该怎么解释。“3005183198.md515114F47DFD62791AC4C87527CED1AA5.
PDF
” 我知道我应该以"0-
9
+“开始,以\.
pdf
结束,只是不确定我需要添加什么来说明”。
浏览 0
修改于2017-09-07
得票数 1
1
回答
如何
识别
哪些剪辑路径应用于路径或填写
PDF
矢量图形?
虽然我能够提取剪辑路径定义本身,但我无法确定哪些定义适用于正常的笔画或填充
区域
。例如,请参考获取从
PDF
页面中提取的SVG,以及在提取过程中看到的
PDF
图形命令序列的相应转储。从SVG中可以看出,有多个剪辑路径和一个矩形填充
区域
。尽管在定义填充矩形之前定义了多个剪辑路径,但只有在之前定义的圆形剪辑路径矩形定义将与矩形相关联(根据
PDF
页面在各种
PDF
阅读器上的呈现方式,在白色背景中只显示2个填充的圆圈)。问题是如何知道哪些剪辑路径与
PDF
中定义的规则填充/笔画
浏览 2
提问于2013-06-08
得票数 2
回答已采纳
1
回答
在iframe中将src显示为datastring
pdf
不起作用(React - jspdf)
当我点击一个按钮时,我正在尝试生成一个
PDF
来显示订单的收据。我正在使用jsPDF和React。当我调用外部
pdf
时,我实现了显示
PDF
,但当我将数据作为字符串传递时,它显示以下错误:JVBERi0xLjMKMyAwIG
9
iago8PC
9
UeXBlIC
9
QYWdlCi
9
QYXJ… l6ZSAyMAovUm
9
vdCAxOSAwIFIKL0luZm8gMTggM
浏览 2
提问于2017-05-24
得票数 2
1
回答
如何设置PrintArea类的PageSetup属性?
我试着把一页的版面打印成
pdf
。我选择范围,但是当我试图设置打印
区域
时,我得到:无法设置PageSetup类的打印
区域
属性 Application.Goto Reference:="'
9
.ThisWorkbook.Path & "\" firstDate = Format(Date, &q
浏览 5
修改于2022-05-02
得票数 0
1
回答
如何使用wkhtmltopdf在
pdf
页脚中创建可单击链接?
我们希望使用
pdf
页脚的链接。我们利用wkhtmltopdf工具生成我们的pdfs。
浏览 7
提问于2022-11-09
得票数 0
回答已采纳
1
回答
用iTextSharp使用.Net解析
PDF
形状对象
我正试图解析一堆
PDF
格式,它们有一段看起来是文本,但实际上只是一堆看起来像文本的嵌入形状,所以使用iTextSharp中的普通iTextSharp对象提取“文本”是不可能的。由于我试图提取的文本是仅有的10个可能的单词之一,而不是实际上“阅读”这个单词(或者更确切地说,‘以一个单词的形式’形状‘),我想我可以通过与我已经
识别
的其他单词进行比较来确定这个单词是什么。我的第一个问题是,我怎样才能到达
PDF
的这一部分?如何使用iText解析文档以深入到此形状对象?在我所有的文档中都有一个常见的词开始这个部分,所以我想我可以用它作为一个地标来知道
浏览 3
修改于2011-09-09
得票数 1
1
回答
Camelot-py未检测到一行中的两行文本
使用Camelot-py从.
PDF
抓取表数据,但它不会拾取堆叠的文本行(请参阅下面的第
9
行和第10行) tables= camelot.read_
pdf
(r'C:\PDFFilePath', pages='
9
', line_scale=40) camelot.
浏览 14
修改于2020-03-12
得票数 1
2
回答
Java中
PDF
文本提取
我有一个用iText生成的
PDF
文件,它是用JasperReports创建的(我不知道它是否相关),我想知道是否可以找到一些API或任何东西来查看结构,因为我需要从中提取文本。如果我试图以DOCX的形式打开它,我会看到这个词可以
识别
某种结构,例如,在DOCX中转换后,一个看起来像
PDF
中的表的
区域
实际上是一个表。 我需要了解
PDF
是如何创建的,如果这是可能的话。我知道使用
PDF
格式并不容易,但我需要从一些有用的东西开始。谢谢!
浏览 1
修改于2018-07-11
得票数 1
3
回答
tesseract无法拾取页面右侧的字符
当遍历
pdf
页面时,tesseract
识别
一个页面上的字符,类似于:Table 2 Unique Data5Table 3 Reservoir Data 8它去掉最后一个数字,因此输出类似于Table 4 Surface Data 数
浏览 0
提问于2020-06-06
得票数 2
1
回答
禁用输入字段中Unicode字符的范围
我有一个用于纯文本的文本
区域
,用户有时可以复制和粘贴特殊字符。当使用表情符号时,它就成了一个问题,因为它是我们需要包含在
PDF
文件中的材料。例如:❤️现在我的问题是,在验证表单时,我如何
识别
这些字符并用Javascript删除它们呢?我不想限制太多,因为很多语言(俄语,阿拉伯语等等)都是被允许的。
浏览 0
提问于2014-11-10
得票数 0
回答已采纳
2
回答
将每个命名范围
PDF
到单个页面- VBA
然后,在引用选项卡上填充所有命名
区域
,它们在相应单元格中的位置。我需要写一个宏,
PDF
的每个命名范围在单独的网页上,但作为一个单一的
PDF
文件。2)命名
区域
位于10个单独的工作表上。3)一些工作表上有多个命名
区域
。这并不总是一对一的,这意味着我需要它来
PDF
来自同一张工作表的多个命名范围,但结果必须仍然是每个
PDF
页面一个命名范围。$K$2:$R$21Range10, =Shee
浏览 1
修改于2019-01-04
得票数 1
1
回答
无法提交要分析的表单
我已经创建了我的表单
识别
器AI,对它进行了训练,并收到了modelID,但当我实际在Powershell中实现它时,它出错了,告诉我它无法读取文件,所以我怀疑这与我发送的文件有关。这是针对表单
识别
器2.0的,有什么建议吗?aiFormRecognizerEndPoint = 'https://{Url}.cognitiveservices.azure.com/' $aiModelToUse = 'f11f43a7-6207-4dc
9
-
9
e8a-fc58677047
浏览 14
修改于2019-12-21
得票数 0
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券