我们正在关闭The Conversations Network (包括IT Conversations播客)。我们的计划是呈现我们网站的静态超文本标记语言版本,以便在Internet Archive上永久托管。
从PHP动态生成的大约5000个动态页面中生成静态HTML的最简单方法是什么?
我知道我们可以调整代码以缓存PHP输出,将其写入文件,然后遍历站点地图以生成每个页面。但我想知道是否有我们应该考虑的选择。有没有什么工具可以做到这一点,并按原样抓取HTML?(除了Acrobat Pro?)
不幸的是,我们也有相当数量的Ajax调用,这将使这变得更加困难。我想我们必须先取消Ajax。
发布于 2012-09-27 03:53:47
有一个很棒的软件叫做"Teleport Pro“(不幸的是payware),它可以创建一个网站的可浏览/复制的副本。一旦上传到服务器,它的工作方式应该与原始站点完全相同。
不过,当你从动态页面创建静态html时,需要记住的事情是;
你当前的ajax调用需要解压(如你所说的yourself)
但是"Teleport pro“是一个真正可靠的程序,它已经存在了很长一段时间。我以前用过它,可能还会再用一次。
另一种方法可能是创建缓存的php模块"php-apc“。在这种情况下,你需要抓取整个网站,然后才能创建完整的缓存。我不太熟悉它,但安装很容易完成,您可以看到生成的文件是否有用。
发布于 2012-09-27 04:41:58
它可能不是你要找的;但是HTTrack会浏览你的网站寻找链接,并保存它的超文本标记语言版本。此镜像将包括所有链接的静态内容,如图像、css和javascript。
我能想到的唯一问题是,如果您的AJAX脚本从一个服务器中提取重要数据,但HTTrack可能对此有一个设置。
https://stackoverflow.com/questions/12608622
复制相似问题