我尝试使用gzip解压一个warc.gz文件,结果出现了一个WARC,但它不能在http://replayweb.page中加载。
使用解压工具解压后,我得到了所有展开的html和其他文件。
将warc.gz转换为warc的最新推荐方法是什么?由于某些原因,我在尝试为这项简单的任务寻找建议时遇到了困难。
谢谢!
发布于 2021-08-01 20:21:39
编程方式是使用"warcio“python lib,命令行方式是使用warctools中的"warc2warc”实用程序。
https://stackoverflow.com/questions/66619306
相似问题