我正在学习使用一个仅以网页形式发布其手册的软件包,http://www.orcina.com/SoftwareProducts/OrcaFlex/Documentation/OrcFxAPIHelp/Default_Left.htm#StartTopic=html/Matlab_Introduction.htm
如果我可以将网络手册转换为PDF文件,我会更快地学习软件包,因为我可以在Acrobat Pro中用注释和下划线标记PDF。我尝试将每个部分打印成单独的PDF,然后将它们连接成一个PDF,但有>100个部分,所以速度很慢。
有没有更好的方法来将整个web手册文档转换成单个PDF文件,并将手册内容按正确的顺序排列?
发布于 2011-02-10 02:40:30
在acrobat pro中,你应该能够直接打开网页,它会为你将网页转换成PDF格式。
ctrl+shift+O (哦,不是零,这在v9和vX中都可以用)
我相信你也可以告诉它在一定程度上向外爬行。是的..。但这并不管用。我得到了一张空白页。看起来大部分内容都是通过脚本/ajax类型填充的。
这不是一个编程解决方案,但它仍然是一个解决方案。
wkHTMLToPDF将处理脚本,但我不知道它是否会为您做任何爬行。
发布于 2011-02-10 00:52:32
您应该使用HTML/XML解析器对每个页面进行屏幕抓取,将整个文档存储在某个本地数据结构中,然后使用该数据结构将内容粘贴到PDF库中并将文档另存为PDF。
https://stackoverflow.com/questions/4947808
复制相似问题