如何使用Python将PDF文件转换为HTML?
我在想一些关于Google做(或似乎做)索引PDF文件的事情。
我的最终目标是将Apache设置为显示PDF文件的HTML,所以任何引导我朝这个方向前进的东西都将不胜感激。
发布于 2008-11-09 20:34:05
poppler包提供了一个您可能能够使用的pdf2html实用程序。还有一个指向libpoppler的Python binding。
https://stackoverflow.com/questions/276434
复制相似问题