在使用Jpedal解析PDF时,我遇到了一个问题。
在从Jpedal中读取wordlist时,我在wordslist中得到了混淆的字符。在使用OCR时,以及当我从PDF中复制文本并粘贴到Word或简单的文本编辑器时,也会发生这种情况。据我所知,这个PDF是由Quartz PDF上下文在MAC 10.6.4上生成的,它用于压缩文件大小,但在查看器上很容易查看。我搜索了任何支持解码这种PDF的Java,但都失败了。我正在寻找可以用来解码它的任何应用程序或Java;必须可以在Linux机器上使用。
发布于 2010-07-16 13:49:09
各位
我在贴出一个解决问题的可能方法。这里是链接描述了石英是如何解析pdf的,当然,这需要在代码中实现,因为到目前为止,我还没有为它找到任何现成的API,我相信堆栈溢出是关于主动,做和回答以前没有做过的或者没有问过的问题。
问候
里图拉伊
https://stackoverflow.com/questions/3166718
复制相似问题