我想知道是否可以用Pdfminer编辑现有的pdf文件。它看起来是一个强大的工具,但文档很差/不存在。我找到了一些例子,但它们与我的目标不匹配。我想做一个搜索引擎,改变我在pdf文件中的关键字的颜色。
发布于 2011-11-24 05:53:49
PDFMiner不是用来修改现有的PDF文件的,而是用来提取文本和元数据的。使用PDFMiner最接近的解决方案可能是使用包含的pdf2txt.py工具提取文本,然后标记突出显示您的关键字。
还有一个简单的选择,就是使用一个内置的PDF查看器来查找和高亮显示多个搜索词。我认为Adobe Acrobat可以做到这一点,但我不确定其他人。
发布于 2011-11-25 21:36:34
不支持,pdfminer不支持编辑。
但是,如果您不尝试修改pdf,而是使用PDFOpenParameters:http://partners.adobe.com/public/developer/en/acrobat/PDFOpenParameters.pdf,这可能会容易得多。
您可以像这样使用url片段标识符:
http://www.example.com/test.pdf#search=foo或者甚至在命令行上打开Acrobat时(Windows示例)
AcroRd32.exe /A "search=foo" test.pdf您也可以打开pdf的特定页面,并突出显示该页面的某个区域(但不能同时在不同页面上的不同区域)。
(好的,我知道这不是你所问的问题的真正解决方案,但如果这足以满足你的需求,那就简单多了)
https://stackoverflow.com/questions/8248622
复制相似问题