我们有一个专有的在线书籍/手册生成系统,可以从数据库中创建编译的帮助文件(CHM)以及HTML版本的内容。
这个系统运行得很好,几年来我们一直在使用这个系统,没有进行重大的修改。
现在,我们也想从相同的来源生成PDF。我看过一些CHM- to -PDF和HTML- to -PDF转换器,但我还没有找到一个能够正确处理超链接的转换器,尽管这里提出了许多类似的问题,但似乎没有人找到一个好的解决方案(或者至少他们没有费心发布任何关于它的信息)。
有什么建议吗?我讨厌不得不写一个PDF生成器,因为在这方面已经做了这么多工作。
发布于 2011-10-15 02:48:28
通常,所有这些都是从一个抽象的源代码生成的。html作为一种标准是如此的广泛,很难创建一个通用的HTML转换成非HTML的东西,输入可能是几乎所有的东西。而且CHM对HTML的支持似乎和MSIE差不多(阅读:很多)
因此,最明智的做法可能是确定用于实现基本格式的HTML子集,并尝试从中生成一些内容。考虑通过编辑(批量替换)和脚本来简化html,然后以最小的格式(以及某种抽象形式)提取大部分内容。
一般情况下html->的转换器是非常困难或者不是最优的(想一想把渲染内容的图片放到PDF中),所以你总是在谈论子集。
发布于 2011-11-04 23:18:56
我是一家转换html to pdf的公司的所有者之一:博士。
下面是一个示例,我相信它演示了对超链接的“正确”处理。也就是说,外部链接被发送到默认的web浏览器,并且散列链接跳转到PDF中“Test!”的相关位置。就会出现。您可以查看此示例here的PDF输出。
<html>
<head>
<style type="text/css">
hr {page-break-after:always;}
</style>
<body>
<a href="http://www.google.com">Google</a>
<a href="#test">Test?</a>
<hr />
<h1 id="test">Test!</h1>
</body>
</html>此示例中的hr样式只是为了让我有两页文本,以便链接可以演示功能。
https://stackoverflow.com/questions/7769934
复制相似问题