我可以这样计算tarfile中文件的大小:
import tarfile
tf = tarfile.open(name='my.tgz', mode='r')
reduce(lambda x,y: getattr(x, 'size', x)+getattr(y,'size',y), tf.getmembers())但是返回的总大小是tarfile中元素的总和,而不是压缩文件的大小(至少这是我在尝试时所相信的)。有没有一种方法可以获得整个tar文件的压缩大小,而不需要通过像os.path.getsize这样的东西进行检查?
发布于 2012-04-05 20:22:52
不是的。
tar.gz的工作方式是通过gzip传输文件,以获得一个普通的tar归档。tar(1)不知道归档文件最初是被压缩的,所以它不能知道压缩大小*。
这与ZIP等自行压缩的归档格式不同。
tar方法的优点是您可以使用您喜欢的任何压缩。如果有更好的压缩器出现,你可以很容易地重新打包你的档案。此外,由于所有内容都放在一个大数据流中,因此压缩比稍好一些,文件名等元数据也会被压缩。
缺点是您必须在存档文件中查找才能解压缩单个项目。
*:tar(1)的第一个实现没有-z选项;后来当人们开始大量使用gzip时,才添加了这个选项。在早期,标准压缩是使用compress来获得tar.Z。
https://stackoverflow.com/questions/10028435
复制相似问题