我需要使用salt (~20个符号)为~4000万个字符串生成md5散列,
md5 (字符串+盐)
检查冲突,然后将它们保存到bd。然后,当盐发生变化时,我需要用新的盐生成新的散列,检查冲突,并检查与旧散列的冲突。
这里有没有能帮到我的地方?也许bloom filter能帮上忙?是否可以使用HashMap检查冲突?
发布于 2012-09-21 18:30:46
我建议将生成的md5散列插入到数据库中,并检查循环的每次迭代。您可以在"hash value“列中创建索引,以便进行更快的搜索。表将非常大,您还可以将散列划分到几个表(甚至数据库)中,使用不同的第一个字符或第一组字符(hashes_aa、hashes_ab等)。
你是否经常更换盐,以至于这个解决方案对你不起作用?
编辑:冲突将非常非常罕见,您可以跳过检查吗?
https://stackoverflow.com/questions/12527710
复制相似问题