腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
1
回答
有没有一种方法可以使用Perl在
PDF
的特定
区域
内进行文本搜索?
我有由PDFcreator创建的
PDF
。每个多页
PDF
的第一页都有需要
识别
的邮寄地址。有没有办法在
PDF
的特定
区域
内进行文本搜索? 我已经找到了和,但看不到将搜索限制在特定
区域
的方法。我主要关心的是准确性,因为在同一个
PDF
中可能会出现不同的地址。另外,搜索整个
PDF
可能太慢了。
浏览 5
修改于2017-05-23
得票数 0
1
回答
在我的网页上使用
PDF
文件的
内容
有什么问题吗?
当我搜索一个项目时,谷歌会推荐
PDF
格式的结果。谷歌如何
识别
PDF
内容
?在我的网站上使用
PDF
文件的
内容
有什么问题吗?该网站的
内容
是否会被谷歌
识别
为重复
内容
?会不会对网站的搜索引擎优化产生负面影响?
浏览 0
修改于2018-10-20
得票数 3
回答已采纳
1
回答
如何使用Java从
PDF
中的特定矩形
区域
提取数据?
我试图从
PDF
中给定的两个坐标指定的特定矩形
区域
中提取数据。是否可以在
PDF
中执行此操作,或者我是否必须将其转换为图像并使用OCR?如果有,PDFBox或iText是否包含通过光学字符
识别
来分析图像的方法?谢谢!
浏览 26
提问于2017-12-26
得票数 3
回答已采纳
1
回答
Ghost脚本更改输入
pdf
的尺寸
我正在使用gs 9.20,并试图从
pdf
文件中使用以下命令生成eps文件。
内容
区域
(灰色)之外的
区域
是空白
区域
。
PDF
:这里的尺寸以点为单位(来自Adobe Illustrator的屏幕截图)EPS:这里的尺寸以点为单位(来自Adobe Illustrator的屏幕截图) 下面是pdfinfo -bo
浏览 2
修改于2017-03-24
得票数 0
1
回答
使用
PDF
Clown实际裁剪
PDF
我的目标实际上是用PdfClown裁剪一个
PDF
文件。有很多工具/库,允许裁剪
PDF
,改变
PDF
cropBox。这允许在矩形
区域
之外隐藏
内容
,但
内容
仍然在那里,它可以通过
PDF
解析器访问,并且
PDF
大小不会改变。我已经看到有
浏览 2
修改于2017-05-23
得票数 2
3
回答
c#将
PDF
转换为Tif
我正在使用ghostscript转换
PDF
的Tif与C$类包装,然后是使用光学字符
识别
tessnet2读取图像文件的
内容
,但tif图像是相当不可读,图像是相当褪色的,看起来不正确,光学字符
识别
引擎无法读取任何东西有没有开放源码或库,可以花我几块钱就可以将
PDF
转换成高质量的TIf?或者任何可以读取
PDF
的开源光学字符
识别
引擎,因为tessnet2不能读取
PDF
。
浏览 6
提问于2012-08-31
得票数 0
回答已采纳
1
回答
从扫描的文档中提取数据c#
我有一个
PDF
文件,其中包含我们需要导入到数据库中的数据。该文件是打印文本的
pdf
扫描。数据的结构如下Date : 01/12/2014但这些数据并不总是出现在document.So的相同
区域
中,我需要一个可以
识别
这些文件的工具或应用程序接口。
浏览 2
提问于2015-01-21
得票数 0
1
回答
如何在将文档从
PDF
转换为文本时处理unicode字符编码问题
我正在尝试从
PDF
中提取文本。
PDF
包含印地语(Unicode)文本。我使用的提取实用程序是Apache PDFBox ( )。提取器提取文本,但文本无法
识别
。我尝试了在多种编码和字体之间切换,但仍然无法
识别
预期的文本。下面是一个例子:假设
PDF
中的文本是:पवार有什么建议吗?
浏览 3
提问于2011-09-20
得票数 4
回答已采纳
1
回答
Camelot
PDF
维数
在发布这篇文章之前,我已经对堆栈溢出进行了广泛的搜索,并没有在camelot页面的维度上找到任何
内容
。存在问题,它建议使用table_region,但这并不能解决OP的问题或我的问题。我想做的事: 我使用Camelot来
识别
表(很明显)。有时,当我知道页面中可能包含感兴趣表的
区域
时,我只想在该
区域
中搜索。使用camelot.read_
pdf
()的table_region kwarg很容易做到这一点--我只需要为Camelot提供一对搜索坐标。被检测到的最小行的大小是通过将
PDF
页面的维度
浏览 1
提问于2019-12-03
得票数 4
8
回答
如何用Ruby在现有
PDF
上进行编辑或编写?
我有几个
PDF
模板文件与复杂的
内容
和几个空白的
区域
/
区域
在他们。我需要能够在这些空白
区域
中写入文本,并将结果
PDF
保存在文件夹中。PHP中有,它可以用来简单地打开一个
PDF
文件,并在现有
内容
的基础上编写/绘图。的问题是:有什么更好的方法来编辑、编写或绘制现有的
PD
浏览 7
修改于2017-05-23
得票数 42
回答已采纳
1
回答
ALFERCO5.2中“`autoRename`”属性中的错误
我使用autoRename属性创建
内容
,如下所示(虚拟)。"1","autoRename":true,"properties":{"cm:title":"yoB4004-RA.
pdf
","cm:description":"yoB4004-RA.
pdf
"}},{"cm:title":"yoB4004-RA2.
pdf
","cm:descri
浏览 3
修改于2018-04-28
得票数 2
回答已采纳
1
回答
用Java/Kotlin文件检测unicode专用
区域
(PUA)字符
是否有正确的方法来
识别
Java/Kotlin中的Unicode私有使用
区域
(PUA)字符? 一些背景,我们正在使用
PDF
转换工具,它不支持PUA字符。因此,我们需要标识文件中可用的任何PUA字符。
浏览 4
提问于2022-04-20
得票数 1
1
回答
如何使用grails渲染服务打印折叠标记?
客户希望在生成的
pdf
中具有折叠标记和重复的背景图像。我试过 @page { }如中所述,但
pdf
的
内容
周围总是有一个白色/空白边框。客户希望他的背景在整个
pdf
和这个白色/空白
区域
内的折叠标记上延伸。对我来说,grails renderingservice为可能无法打印的
区域
保留了一些空
浏览 1
提问于2014-02-04
得票数 0
3
回答
PDF
数据提取-需要建议
我创建了一个
pdf
提取工具。样品屏幕附加。 现在的问题是,有时在一些pdfs中,提取所需的部分数据被转移到下一页。(移动的原因是;我将给出一个示例。因此,现在我考虑的是,
识别
pdf
的结构,而不是获取坐标.。 但我没有明确的想法去做。请分享任何东西,你认为这对解决这个问题有帮助。我再次重申,我正试图从
pd
浏览 1
修改于2015-11-12
得票数 2
回答已采纳
1
回答
设置WPF滚动查看器的可滚动
区域
大小
我使用ScrollViewer来滚动滚动查看器中的
内容
。现在,我还需要能够缩放
内容
,我使用RenderTransform来扩展
内容
,但是ScrollViewer不
识别
缩放的
内容
(可滚动
区域
没有增长)。如何手动计算和设置ScrollViewer的可滚动
区域
?让我们坐下来--即使
内容
只有100 x 100像素,我们还是希望滚动
区域
类似于1000 x 1000像素。
浏览 7
提问于2013-11-01
得票数 0
回答已采纳
1
回答
我想阅读带有图像、文本和表格的
PDF
内容
我是一个非常新的阅读
PDF
内容
与图像,文本和表格。我浏览过许多网站,我使用iTextSharp (TextWithFontExtractionStategy)读取
内容
并将其转换为HTML,我只处理文本。我在许多网站上寻找建议,但我找不到解决方案。现在,我想要实现的是我想从
PDF
中读取包含文本、图像和表格的
内容
,并将其转换为HTML。我知道
识别
图像和表格是很困难的。对于图像-我不想从
PDF
中提取图像,因为我要为图像保留一些占位符,以便我可以给出一些替代文本。如果存在图像,
浏览 2
提问于2019-01-04
得票数 0
1
回答
如何
识别
哪些剪辑路径应用于路径或填写
PDF
矢量图形?
虽然我能够提取剪辑路径定义本身,但我无法确定哪些定义适用于正常的笔画或填充
区域
。例如,请参考获取从
PDF
页面中提取的SVG,以及在提取过程中看到的
PDF
图形命令序列的相应转储。从SVG中可以看出,有多个剪辑路径和一个矩形填充
区域
。尽管在定义填充矩形之前定义了多个剪辑路径,但只有在之前定义的圆形剪辑路径矩形定义将与矩形相关联(根据
PDF
页面在各种
PDF
阅读器上的呈现方式,在白色背景中只显示2个填充的圆圈)。问题是如何知道哪些剪辑路径与
PDF
中定义的规则填充/笔画
浏览 2
提问于2013-06-08
得票数 2
回答已采纳
1
回答
从阴影DOM获取元素
在我正在进行的项目中,我有一个HTML文档,该文档是通过应用程序生成的,然后传递给一个函数,该函数将HTML转换为
PDF
。经过一些测试后,我发现文本
区域
内容
的编辑版本在Shadow DOM中。有没有办法获取该
内容
并将其放入实际的DOM中? 我并不是在显式地将
内容
放在那里,但是使用Firebug和WebI
浏览 1
提问于2014-09-29
得票数 4
回答已采纳
1
回答
裁剪
PDF
而不保留不可见
内容
(.NET或ObjC)
我正在尝试使用.NET (使用
PDF
4NET或iTextSharp,但不关闭这些)或Objective-C (CGContextXXX,CGPDFXXX等)来裁剪
PDF
。但不保留不可见的
内容
!目前,我可以使用裁剪框或剪辑
区域
进行裁剪操作,但所有不可见的
内容
仍然存在于
PDF
中...谢谢(对不起,我是法国人……)
浏览 2
修改于2011-10-26
得票数 1
回答已采纳
3
回答
当在
pdf
.js中的空格上拖动时,防止文本选择从“跳转”到顶部
我正在使用带有文本选择的
pdf
.js。如果你去他们的例子,你可以看到我所描述的。试着在左栏的几个段落上选择文本,你会看到选择“闪烁”到选择顶部的所有
内容
。我认为这与所有持有绝对文本的div有关。
浏览 0
提问于2014-04-05
得票数 8
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券