有没有一种通过VBA读取PDF文件以提取基本文本内容的免费方法?我需要在我的公司自动执行每周数据采集过程,其中数据包含在PDF文件中(由数据提供商每周更新)。另外,有没有参考资料可以帮助我理解文件结构(DOM?)一份PDF文件?
发布于 2011-04-29 00:40:48
Adobe的PDF参考资料在这里在线:http://www.adobe.com/devnet/pdf/pdf_reference.html
我不确定直接从VBA中读取iText的最好方法,但是如果你可以调用一个外部的Java或C#程序,那么我建议你在basic text extraction中使用PDF。
编辑:也许我应该提一下Adobe的PDF参考是一个800页的野兽。我发现它很适合查找特定问题的答案(例如,存储嵌入的truetype字体的宽度),但它可能不是一个好的起点。为此,通读iText book帮助我开始了解这种格式。
发布于 2011-04-29 01:51:55
这本IText书包含了许多关于一般IText任务的工作示例和大量的背景信息,以帮助您理解PDF文件。它很快就能收回成本!
https://stackoverflow.com/questions/5821919
复制相似问题