首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用pdf2htmlEX将pdf拆分成多个html文件

使用pdf2htmlEX将pdf拆分成多个html文件
EN

Stack Overflow用户
提问于 2014-10-14 20:25:22
回答 1查看 1.2K关注 0票数 1

我正在尝试将PDF文件拆分成单独的HTML文件。我的意思是,对于每个PDF页面,我需要一个HTML文件。我是这样做的:

代码语言:javascript
复制
pdf2htmlEX --split-pages 1 LMS.pdf --page-filename lms%03.html

在结果中我得到了一个空的LMS.html和其他文件:lms%031.htmllms%032.html。问题是这些html文件的格式不正确,没有CSS样式吗?

EN

回答 1

Stack Overflow用户

发布于 2015-01-09 03:23:42

有趣的是...我在试着解决一个相同的问题时偶然发现了你的问题。我使用了与您相同的命令,只是没有设置--page-filename参数。使用您的示例,我的pdf2htmlEX调用类似于:

代码语言:javascript
复制
pdf2htmlEX --split-pages 1 LMS.pdf 

然后,我在Chrome中打开了主HTML文件,发现了一堆空白页面。在搜索了一下之后,我在Firefox中打开了同样的文件。啊,真灵。非常奇怪。控制台输出中未报告错误。当然,我甚至没有想过要查看Chrome控制台的输出。当我这样做时,我发现:

代码语言:javascript
复制
Uncaught NetworkError: Failed to execute 'send' on 'XMLHttpRequest': Failed to load 'file:///...'.

感谢上帝给了StackOverflow。我不知道为什么它在Firefox中工作,但如果你得到的是Chrome报告的错误,你需要运行一个web服务器。

对我来说,最简单、最快的方法是切换到我转换PDF的目录,然后运行:

代码语言:javascript
复制
python -m SimpleHTTPServer

默认情况下,您的页面将在http://localhost:8000上提供。问题解决了。使用任何最适合您的服务器。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26360767

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档