我正在尝试将PDF文件拆分成单独的HTML文件。我的意思是,对于每个PDF页面,我需要一个HTML文件。我是这样做的:
pdf2htmlEX --split-pages 1 LMS.pdf --page-filename lms%03.html在结果中我得到了一个空的LMS.html和其他文件:lms%031.html,lms%032.html。问题是这些html文件的格式不正确,没有CSS样式吗?
发布于 2015-01-09 03:23:42
有趣的是...我在试着解决一个相同的问题时偶然发现了你的问题。我使用了与您相同的命令,只是没有设置--page-filename参数。使用您的示例,我的pdf2htmlEX调用类似于:
pdf2htmlEX --split-pages 1 LMS.pdf 然后,我在Chrome中打开了主HTML文件,发现了一堆空白页面。在搜索了一下之后,我在Firefox中打开了同样的文件。啊,真灵。非常奇怪。控制台输出中未报告错误。当然,我甚至没有想过要查看Chrome控制台的输出。当我这样做时,我发现:
Uncaught NetworkError: Failed to execute 'send' on 'XMLHttpRequest': Failed to load 'file:///...'.感谢上帝给了StackOverflow。我不知道为什么它在Firefox中工作,但如果你得到的是Chrome报告的错误,你需要运行一个web服务器。
对我来说,最简单、最快的方法是切换到我转换PDF的目录,然后运行:
python -m SimpleHTTPServer默认情况下,您的页面将在http://localhost:8000上提供。问题解决了。使用任何最适合您的服务器。
https://stackoverflow.com/questions/26360767
复制相似问题