腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
搜索
关闭
文章
问答
(9999+)
视频
开发者手册
清单
用户
专栏
沙龙
全部问答
原创问答
Stack Exchange问答
更多筛选
回答情况:
全部
有回答
回答已采纳
提问时间:
不限
一周内
一月内
三月内
一年内
问题标签:
未找到与 相关的标签
筛选
重置
2
回答
保存多个文件并将其重命名为
PDF
,而无需同时询问位置
EMEA.doc --
改名
-> EMEA 083117.doc -> EMEA 082317.
PDF
3.LATAM.doc --
改名
-> LATAM 083117.doc --> LATAM 082317.
PDF
我需要ExportAsFixedFormat(
PDF
)这些.Doc文件。ActiveDocument.E
浏览 7
修改于2017-08-31
得票数 0
回答已采纳
2
回答
如何从不可搜索的
pdf
中检测出可搜索的
pdf
?
我有一堆
pdf
文件,一些是可搜索的常规
pdf
文件,一些是一些不可搜索的文件的扫描版本。我想
提取
每个
pdf
的
内容
。要
提取
常规的
内容
,我使用
pdf
;要从不可搜索的pdfs中
提取
内容
,我使用
pdf
。然而,我需要区分哪个
pdf
是正常的
pdf
,哪个不是。有没有办法做到这一点?
浏览 4
提问于2015-07-09
得票数 2
1
回答
用Java实现
PDF
内容
验证的自动化解决方案
我正在做
PDF
内容
验证的POC,这将基本上验证
PDF
文件的
内容
。但我没有找到任何解决办法。我正在寻找的解决办法:
提取
PDF
内容
,并可能将其以某种结构化格式放入 根据预期值验证实际
提取
的
内容
浏览 0
修改于2020-02-14
得票数 1
2
回答
使用Adobe API
提取
PDF
内容
我正在尝试读取
PDF
文件的
内容
,该文件由多个表组成。使用Java和Adobe API,如果所有单元格都有一行
内容
,我就能够
提取
表格中的
内容
。当单元格有多行时,问题就出现了,这会导致
提取
的
内容
移动到下一行,从而导致与表头不对齐。 有没有什么方法可以从
PDF
中按原样
提取
内容
,同时保持表格格式与在
PDF
中显示的方式相同?我目前正在使用\t转义字符来
提取
数据。
浏览 56
修改于2015-02-11
得票数 2
2
回答
使用批处理文件脚本重命名文件
我想使用批处理脚本重命名文件夹中的所有
PDF
文件。例如,我在文件夹中有3个文件:otherfile.
pdf
,现在我想将文件重命名为:-
PDF
1.
pdf
,我已经使用这个脚本获取了文件%%F IN (*.
pdf
) DO ( SETLOCAL EnableDelay
浏览 2
提问于2014-08-21
得票数 0
1
回答
使用C#阅读突出显示的文本(突出显示注释)的iTextSharp
我正在开发一个C# winform应用程序,将
pdf
内容
转换为文本。除了在
pdf
的高亮文本中找到的
内容
之外,所有需要的
内容
都被
提取
。请帮助获取工作样本,以
提取
在
pdf
中发现的突出显示的文本。
浏览 3
提问于2014-04-28
得票数 1
1
回答
提取
pdf
格式
大家好,在一个主要工作是
pdf
编辑的应用程序上工作。因此,我想
提取
整个
pdf
文件的
内容
,并在编辑后创建一个新的
pdf
。现在我需要知道如何
提取
pdf
格式(页眉,页脚,图像,突出显示。,,)提前谢谢。
浏览 3
提问于2011-08-04
得票数 0
1
回答
pdfplumber extract_text函数也可以从表格中
提取
文本。只想
提取
表外的文本
我有一个包含文本和表格的
pdf
。我想将它们都
提取
出来,但是当我使用extract_text函数时,它也会
提取
表中的
内容
。我只想
提取
表外的文本,并且可以使用extract_tables函数
提取
该表。我测试了一个只包含表格的
pdf
,但仍然使用extract_tables函数
提取
我想要
提取
的表格
内容
。
浏览 232
提问于2021-10-01
得票数 0
1
回答
如何在android中使用itextpdf从马拉蒂、印地语
pdf
文件中
提取
文本
我使用itextpdf从我的android应用程序中的
pdf
中
提取
文本。对于有英语语言的
pdf
来说,它很好,但是当我试图从marathi或印地语
pdf
中
提取
文本时,它并不是
提取
正确的文本。तीं 请帮助我
提取
适当的
内容
。
浏览 0
提问于2016-12-02
得票数 2
回答已采纳
1
回答
如何在Java中从
PDF
文件中
提取
表格数据
我对从
PDF
文件中
提取
数据有疑问。我有一个
PDF
文件,其中有多个可用的数据表。我想从require表
内容
中
提取
数据。如何使用iText/PDFBox执行此操作?
浏览 2
修改于2018-02-14
得票数 0
5
回答
从
PDF
中
提取
所有
内容
寻找从
PDF
文件中
提取
内容
的解决方案(使用控制台工具或库)。 现在我们使用的是开源
pdf
2xml (
提取
文本、图像和链接)和GhostScript (快照和缩
浏览 7
修改于2015-06-02
得票数 8
回答已采纳
1
回答
如何
提取
包含CheckBox (X)数据的C#格式
我正在编写
PDF
,主要思想是
提取
pdf
内容
,包括图像、文本以及复选框,至于文本和图像,我
提取
文本
内容
和图像,但我无法
提取
复选框数据。
浏览 24
提问于2022-09-14
得票数 0
3
回答
以编程方式或通过调用外部实用程序从
PDF
提取
字体
我正在开发
PDF
到电子书的转换器,这将在服务器上运行。 我需要以编程方式从
PDF
文件中
提取
嵌入式字体来完成该项目。现在我可以
提取
图像和文本,但为了在Flash播放器中准确显示
内容
,我需要从
PDF
中
提取
字体并编译为SWF,以便在运行时由Flex应用程序加载。我想知道这是否可能,因为SWFTools的
pdf
2swf.exe这样的工具可以做到这一点。我已经反编译了这个工具生成的swf文件,里面嵌入了字体。
提取
的字体将用于仅在Flash pl
浏览 1
修改于2009-11-18
得票数 0
回答已采纳
1
回答
如何使用pdflib逐句获取文本?
是一个很好的分析
PDF
的软件。当我使用它从
PDF
中
提取
文本时。如何逐句
提取
文本?现在我只能按单词、行、页进行
提取
。例如,在
PDF
中提供以下
内容
:Sentence by sentence. Is there anybody can help?,line模式每次返回一行(即我想从
pdf
中
提取
文本;句子在那里;任何男孩都可以帮助?)。页面模式返回整个段落。
浏览 3
修改于2016-05-26
得票数 0
2
回答
在.NET应用程序中使用pdfbox从
pdf
中
提取
嵌入式文件
我正在开发.NET应用程序使用
PDF
.I从
PDF
.I中
提取
元数据,
内容
和附件。我能够
提取
元数据和
内容
,但在
提取
附件/嵌入文件时被卡住。java.util.Map<String, COSObjectable> names = efTree.getNames(); 所以,如果有人能帮我从
pdf</e
浏览 1
修改于2013-06-11
得票数 0
回答已采纳
1
回答
如何利用iText apis
提取
PDF
水印
内容
我正在浏览itext文档&我能够创建一个包含水印图像或文本的
pdf
,但没有找到从
pdf
中获取/
提取
水印
内容
的方法。因此,我有一个
pdf
文档,包含有水印的文本/图像&我想
提取
该文本或img,并验证这是我无法做到的。 如何使用iText apis
提取
水印
内容
?或者是否有其他方法来验证水印
内容
?通过验证我的意思是,如果我有一个现有的
pdf
/图像与一些水印文本,如在上面的参考文献
浏览 6
修改于2014-02-06
得票数 1
3
回答
如何使用ABCPdf.NET从
PDF
文件的所有页面
提取
文本?
如何使用ABCPdf.NET工具从
PDF
文件中
提取
内容
文本?我尝试了GetText方法,但没有
提取
内容
: Response.Write(xmlCo
浏览 0
修改于2012-06-12
得票数 4
回答已采纳
2
回答
如何使用Zend_
Pdf
从
pdf
页面
提取
文本
有人可以帮助从
pdf
页面中
提取
文本吗?$
pdf
= Zend_
Pdf
::load('example.
pdf
');我假设存在一个页面方法,但是我找不到任何东西可以让我
提取
内容
。
浏览 1
修改于2010-03-23
得票数 2
1
回答
Apache Tika无法从大型
pdf
中
提取
全文
内容
。
我试图从一个大型
pdf
(未扫描/光栅化
pdf
)文件中使用apache
提取
文本。下面是我试过的两个样品。metadataNames) { System.out.println(name+ " : " + metadata.get(name)
浏览 1
修改于2016-11-14
得票数 0
回答已采纳
1
回答
如何在将文档从
PDF
转换为文本时处理unicode字符编码问题
我正在尝试从
PDF
中
提取
文本。
PDF
包含印地语(Unicode)文本。我使用的
提取
实用程序是Apache PDFBox ( )。
提取
器
提取
文本,但文本无法识别。下面是一个例子:假设
PDF
中的文本是:पवार有什么建议吗?
浏览 3
提问于2011-09-20
得票数 4
回答已采纳
第 2 页
第 3 页
第 4 页
第 5 页
第 6 页
第 7 页
第 8 页
第 9 页
第 10 页
第 11 页
点击加载更多
领券