文章/答案/技术大牛

发布

社区首页 >问答首页 >使用pdf2htmlEX将pdf拆分成多个html文件

问使用pdf2htmlEX将pdf拆分成多个html文件
EN

Stack Overflow用户

提问于 2014-10-14 20:25:22

回答 1查看 1.2K关注 0票数 1

我正在尝试将PDF文件拆分成单独的HTML文件。我的意思是，对于每个PDF页面，我需要一个HTML文件。我是这样做的：

pdf2htmlEX --split-pages 1 LMS.pdf --page-filename lms%03.html

在结果中我得到了一个空的LMS.html和其他文件：lms%031.html，lms%032.html。问题是这些html文件的格式不正确，没有CSS样式吗？

发布于 2015-01-09 03:23:42

有趣的是...我在试着解决一个相同的问题时偶然发现了你的问题。我使用了与您相同的命令，只是没有设置--page-filename参数。使用您的示例，我的pdf2htmlEX调用类似于：

pdf2htmlEX --split-pages 1 LMS.pdf

然后，我在Chrome中打开了主HTML文件，发现了一堆空白页面。在搜索了一下之后，我在Firefox中打开了同样的文件。啊，真灵。非常奇怪。控制台输出中未报告错误。当然，我甚至没有想过要查看Chrome控制台的输出。当我这样做时，我发现：

Uncaught NetworkError: Failed to execute 'send' on 'XMLHttpRequest': Failed to load 'file:///...'.

感谢上帝给了StackOverflow。我不知道为什么它在Firefox中工作，但如果你得到的是Chrome报告的错误，你需要运行一个web服务器。

对我来说，最简单、最快的方法是切换到我转换PDF的目录，然后运行：

python -m SimpleHTTPServer

默认情况下，您的页面将在http://localhost:8000上提供。问题解决了。使用任何最适合您的服务器。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/26360767

复制

相似问题

问使用pdf2htmlEX将pdf拆分成多个html文件EN