我正在尝试以文本的形式读取PDF,我可以用垃圾将它写回去,这很好,因为我有一个解析器组件来获取我需要的部分。
我的问题是如何阅读PDF的特定部分而忽略其他部分?
发布于 2017-03-23 08:09:08
如果您的PDF格式良好,您可以使用文本抓取来完成,但这意味着您需要打开PDF文件,并且它必须是可见的,以便本机抓取工作。
https://stackoverflow.com/questions/40059071
相似问题