采用MD5求和是否仍然适用于检查文件重复项?我知道它不安全,但在试图找到文件副本的情况下,这真的很重要吗?
我应该使用SHA系列中的一些东西来代替吗?
此用例中的最佳实践是什么?
发布于 2010-01-03 10:12:13
在这种特殊情况下,算法的选择可能并不重要。在MD5上使用SHA1的主要原因都与创建加密安全签名有关。
对于这个任务,MD5应该是完全可以接受的,因为你可能不需要担心人们恶意地手工创建文件来生成错误的副本。
发布于 2010-01-03 10:49:53
如果你关心性能,我认为首先检查匹配的文件大小会更好,然后使用快速哈希函数(CRC32或MD5,应该比SHA1更快),并尝试使用MD5、SHA1或SHA256 (取决于任务的关键程度)来查找以这种方式发现的可能重复的文件。
发布于 2010-01-03 10:11:22
作为校验和,SHA1比MD5稍好一些。这就是Git所使用的。
https://stackoverflow.com/questions/1993688
复制相似问题