首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >免费阅读PDF文件的库

免费阅读PDF文件的库
EN

Stack Overflow用户
提问于 2011-04-29 00:28:58
回答 2查看 3.4K关注 0票数 0

有没有一种通过VBA读取PDF文件以提取基本文本内容的免费方法?我需要在我的公司自动执行每周数据采集过程,其中数据包含在PDF文件中(由数据提供商每周更新)。另外,有没有参考资料可以帮助我理解文件结构(DOM?)一份PDF文件?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2011-04-29 00:40:48

Adobe的PDF参考资料在这里在线:http://www.adobe.com/devnet/pdf/pdf_reference.html

我不确定直接从VBA中读取iText的最好方法,但是如果你可以调用一个外部的Java或C#程序,那么我建议你在basic text extraction中使用PDF。

编辑:也许我应该提一下Adobe的PDF参考是一个800页的野兽。我发现它很适合查找特定问题的答案(例如,存储嵌入的truetype字体的宽度),但它可能不是一个好的起点。为此,通读iText book帮助我开始了解这种格式。

票数 3
EN

Stack Overflow用户

发布于 2011-04-29 01:51:55

这本IText书包含了许多关于一般IText任务的工作示例和大量的背景信息,以帮助您理解PDF文件。它很快就能收回成本!

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5821919

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档