首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >转储PDF文档( *.pdf)为文本?

转储PDF文档( *.pdf)为文本?
EN

Stack Overflow用户
提问于 2010-11-27 21:28:08
回答 4查看 8.8K关注 0票数 6

我在这里(代码部分)得到了一些很好的帮助,可以将word文档转储为文本。现在,我正在寻找帮助转储PDF文档( *.pdf)到文本?我使用的是Delphi 2010。我更喜欢非组件,非Active-X,solution....as此代码将合并到我自己的组件。

谢谢

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2010-11-27 22:19:12

PDFtext可以做到。不过,您必须支付57美元并部署额外的dll。

票数 3
EN

Stack Overflow用户

发布于 2010-11-28 01:06:18

据我所知,你有两个免费的选择。

首先,xpf包中有一个命令行工具,可以从http://www.foolabs.com/xpdf免费获得

然后,http://mupdf.com项目中的另一个命令行工具

两者都可以很容易地从Delphi中调用。我使用来自xpdf的pdftotext.exe文件,没有任何问题。

票数 6
EN

Stack Overflow用户

发布于 2010-11-28 07:53:57

我一直在使用QuickPDF库在PDF文件中查找文本。我使用函数

代码语言:javascript
复制
GetPageText(ExtractOptions: Integer): string;

从每个页面获取文本,以便可以进行搜索。如果您为ExtractOptions使用0,它将以可读格式返回文本。它不是免费的,但是库和文档都非常好。此外,他们的网站上还托管了一个非常活跃的社区博客。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/4291859

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档