我有一个庞大的MD5散列列表,它占用了相当大的空间。我想知道我是否会通过使用赫夫曼编码编码字符(A-F0-9)来实现(一些)压缩。我做了一个快速的脚本,似乎注意到字符串中的几乎每个字符(A-F0-9)在散列文件中都有相同的频率。
所以我的问题是:散列总是以几乎相等的字母频率产生字符串吗?
发布于 2015-05-23 10:14:40
加密哈希函数将产生具有伪随机属性的输出,因此,当以十六进制表示时,哈希值列表将具有几乎相等的每个字符数。伪随机数据不会压缩,因为压缩会查找模式。如果您有副本,压缩可以减少数据大小。
如果要压缩列表,请使用包含32个字符的十六进制字符串,并将其转换回ASCII字符值,占用16个字符。如果需要文本可读性,可以使用Base64或变体进行编码,这将需要22到24个字符。
https://crypto.stackexchange.com/questions/25852
复制相似问题