首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏若尘的技术专栏

    哈希算法

    所以,我们常听到有人把“散列表”叫作“哈希表”“Hash 表”,把“哈希算法”叫作“Hash 算法”或者“散列算法”。那到底什么是哈希算法呢?哈希算法的定义和原理非常简单,基本上一句话就可以概括了。 但是,要想设计一个优秀的哈希算法并不容易,需要满足的几点要求: 从哈希值不能反向推导出原始数据(所以哈希算法也叫单向哈希算法); 对输入数据非常敏感,哪怕原始数据只修改了一个 Bit,最后得到的哈希值也大不相同 这个原理本身很简单,它是说,如果有 10 个鸽巢,有 11 只鸽子,那肯定有 1 个鸽巢中的鸽子数量多于 1 个,换句话说就是,肯定有 2 只鸽子在 1 个鸽巢内。 但是,如果数据增多,原来的 10 个机器已经无法承受了,我们就需要扩容了,比如扩到 11 个机器,这时候麻烦就来了。因为,这里并不是简单地加个机器就可以了。原来的数据是通过与 10 来取模的。 但是新加了一台机器中,我们对数据按照 11 取模,原来 13 这个数据就被分配到 2 号这台机器上了。

    93574发布于 2021-11-23
  • 来自专栏叽叽西

    哈希算法

    哈希算法历史悠久,业界著名的哈希算法也有很多,比如 MD5、SHA 等。在我们平时的开发中,基本上都是拿现成的直接用。 所以,我今天不会重点剖析哈希算法的原理,也不会教你如何设计一个哈希算法,而是从实战的角度告诉你,在实际的开发中,我们该如何用哈希算法解决问题。 什么是哈希算法? 所以,我们常听到有人把“散列表”叫作“哈希表”“Hash 表”,把“哈希算法”叫作“Hash 算法”或者“散列算法”。那到底什么是哈希算法呢? 哈希算法的定义和原理非常简单,基本上一句话就可以概括了。 但是,要想设计一个优秀的哈希算法并不容易,根据我的经验,我总结了需要满足的几点要求: 从哈希值不能反向推导出原始数据(所以哈希算法也叫单向哈希算法); 对输入数据非常敏感,哪怕原始数据只修改了一个 Bit 这个原理本身很简单,它是说,如果有 10 个鸽巢,有 11 只鸽子,那肯定有 1 个鸽巢中的鸽子数量多于 1 个,换句话说就是,肯定有 2 只鸽子在 1 个鸽巢内。

    74620编辑于 2022-05-17
  • 来自专栏我的博客

    哈希算法

    哈希算法将任意长度的二进制值映射为较短的固定长度的二进制值,这个小的二进制值称为哈希值。哈希值是一段数据唯一且极其紧凑的数值表示形式。 通常用于加密和查找 加密使用小例子: 比如我们在php中传递参数a=12,b=’str’,c=14;我们需要进行参数加密,可以使用md5(‘a=12&b=str&c=14’) 很多公司使用这样的算法进行加密

    73180发布于 2018-05-08
  • 来自专栏用户1175783的专栏

    FNV哈希算法

    # FNV哈希算法 参考文档 # FNV版本 FNV哈希分为3个版本:fnv-0(已废弃),FNV-1,FNV-1a # 算法实现 # FNV-0算法公式 hash = 0 for each byte_of_data to be hashed hash = hash * FNV_prime hash = hash ^ octet_of_data return hash # FNV-1算法公式 hash byte_of_data to be hashed hash = hash * FNV_prime hash = hash ^ byte_of_data return hash # FNV-1a算法公式 FNV_prime 还没有看懂,不过这不影响我们实现通用32位,64位的FNV算法 位数 十进制值 32 16777619 64 1099511628211 128 309485009821345068724781371

    1.2K30发布于 2019-09-18
  • 来自专栏花落的技术专栏

    哈希算法揭秘

    所以,我们常听到有人把“散列表”叫作“哈希表”“Hash 表”,把“哈希算法”叫作“Hash 算法”或者“散列算法”。那到底什么是哈希算法呢?哈希算法的定义和原理非常简单,基本上一句话就可以概括了。 但是,要想设计一个优秀的哈希算法并不容易,需要满足的几点要求: 从哈希值不能反向推导出原始数据(所以哈希算法也叫单向哈希算法); 对输入数据非常敏感,哪怕原始数据只修改了一个 Bit,最后得到的哈希值也大不相同 这个原理本身很简单,它是说,如果有 10 个鸽巢,有 11 只鸽子,那肯定有 1 个鸽巢中的鸽子数量多于 1 个,换句话说就是,肯定有 2 只鸽子在 1 个鸽巢内。 但是,如果数据增多,原来的 10 个机器已经无法承受了,我们就需要扩容了,比如扩到 11 个机器,这时候麻烦就来了。因为,这里并不是简单地加个机器就可以了。原来的数据是通过与 10 来取模的。 但是新加了一台机器中,我们对数据按照 11 取模,原来 13 这个数据就被分配到 2 号这台机器上了。 因此,所有的数据都要重新计算哈希值,然后重新搬移到正确的机器上。

    86500编辑于 2021-12-07
  • 来自专栏AI科技时讯

    算法哈希

    可以将算法思想分为两个部分: 向哈希表中插入一个关键字:哈希函数决定该关键字的对应值应该存放到表中的哪个区块,并将对应值存放到该区块中 在哈希表中搜索一个关键字:使用相同的哈希函数从哈希表中查找对应的区块 ,并在特定的区块搜索该关键字对应的值 哈希表的原理示例图如下所示: 插入关键字:哈希函数对关键字进行哈希,得到哈希值后插入到哈希表对应的地方 搜索关键字:哈希函数对关键字进行哈希,基于哈希值去哈希表中进行查询 比如我们需要将 7 个数 [432, 5, 128, 193, 92, 111, 88] 存储在 11 个区块中(长度为 11 的数组),通过除留余数法将这 7 个数应分别位于如下地址: 比如432, 对11取余数,余数为3,放在03位置 平方取中法 平方取中法:先通过求关键字平方值的方式扩大相近数之间的差别,然后根据表长度取关键字平方值的中间几位数为哈希地址。 例如,在长度为 11哈希表中已经填有关键字分别为 28、49、18 的记录(哈希函数为 Hash(key) = key % 11)。

    3.1K10编辑于 2022-04-18
  • 来自专栏zxctscl个人专栏

    算法哈希

    先固定一个数然后找它前面的数,可以把它前面的数都存在哈希表里面。第一个数前面没有数,就先把这个是放在哈希表里面,然后继续移动到下一个数,继续在哈希表里面找值。 二、算法原理 要保存字符和对应字符出现的值,就用到哈希表。 只有小写字母,只需要开26个大小的数组,只统计s1中每个字符出现的个数就行,来遍历s2时候在哈希表中出现对应的字符就减掉1就可以,只要哈希表里面全部为0就可以,但如果s2中出现的某一个字符,在哈希表里面被减成了负数 二、算法原理 只需要固定当前的值,然后把它前面的值放在哈希表里面,判断一下哈希表里面有没有这个数,有就返回true,没有就返回false。 二、算法原理 固定一个值,把它前面一个值的下标和值都放在哈希表里面,当在它前面找到这个数的时候就把下标拿出来,比较差值,大于规定的值,就把这个数继续放在哈希表里面。

    63710编辑于 2024-04-15
  • 来自专栏学院君的专栏

    Go 数据结构和算法篇(十四):哈希表、哈希函数、哈希冲突和哈希算法

    不过,与之前介绍的查找算法不同的是哈希表的不同记录之间不存在逻辑关系,因此最适合求解的问题是查找与给定值相等的记录,而不适合做范围查询。 补充一张链地址法处理哈希冲突的图示: 链地址法解决哈希冲突图示 三、哈希算法 我们前面分享了哈希表、哈希函数和哈希冲突,哈希算法简单理解就是实现前面提到的哈希函数的算法,用于将任意长度的二进制值串映射为固定长度的二进制值串 执行上述代码,打印结果如下: 哈希算法的一般特性如下: 从哈希值不能反向推导出原始数据(所以哈希算法也叫单向算法,不可逆); 对输入数据非常敏感,哪怕原始数据只修改了一个比特,最后得到的哈希值也大不相同 ; 哈希冲突的概率要很小,对于不同的原始数据,哈希值相同的概率非常小; 哈希算法的执行效率要尽量高效,针对较长的文本,也能快速地计算出哈希值。 4、场景五:哈希函数 前面我们已经提到,PHP 中的 md5、sha1、hash 等函数都是基于哈希算法计算哈希值。

    2.3K30编辑于 2023-03-03
  • 来自专栏该溜子的专栏

    算法哈希

    一:哈希表 1. 两数之和 心得: 1:暴力枚举可以先固定第一个元素,然后去遍历这个元素前面的。

    41900编辑于 2025-01-25
  • 来自专栏全栈程序员必看

    hash 哈希算法_哈希一致性算法

    文章目录 一、哈希函数 定义 特点 应用 常见哈希算法 二、murmurhash 定义 特点 应用 介绍 三、MurmurHash使用 四、性能测试 MurmurHash:(multiply 一、哈希函数 定义 散列函数(英语:Hash function)又称散列算法哈希函数,是一种从任何一种数据中创建小的数字“指纹”的方法。 常见哈希算法 MD系列(MD5)、SHA系列(SHA-1)、CRC,甚至JDK hashCode()也是哈希算法的一种。 二、murmurhash 定义 MurmurHash 是一种非加密型哈希函数,适用于一般的哈希检索操作。 应用 广泛应用于各开源产品,Java 界中 Redis,Memcached,Cassandra,Hadoop,HBase,Lucene,spark,nginx,常见的大数据库底层,都使用了这个算法作为底层的存储算法

    1.4K80编辑于 2022-11-02
  • 来自专栏CSDN博客专家-小蓝枣的博客

    Python 算法基础篇之散列查找算法哈希表、哈希集合、哈希映射

    Python 算法基础篇之散列查找算法哈希表、哈希集合、哈希映射 引言 散列查找算法是一种高效的查找技术,通过散列函数将键映射到数组的索引位置,实现快速的查找、插入和删除操作。 本篇博客将介绍散列查找算法的三种常见应用:哈希表、哈希集合和哈希映射,并通过实例代码演示它们的应用。 ❤️ ❤️ ❤️ 1. 散列查找算法概述 散列查找算法是一种基于散列函数的查找技术,它将键映射到数组的索引位置,从而实现快速的查找、插入和删除操作。在散列查找算法中,关键的组成部分是散列函数,它负责将键映射到数组的索引位置。 其次,散列查找算法的空间消耗较大,因为需要维护一个数组来存储数据。 2. 哈希表的概念 哈希表是散列查找算法的一种常见应用,它是一种数据结构,用于存储键值对。 总结 本篇博客介绍了散列查找算法的三种常见应用:哈希表、哈希集合和哈希映射。哈希表是一种高效的数据结构,用于存储键值对并支持快速的查找、插入和删除操作。

    87200编辑于 2023-07-24
  • 来自专栏烟草的香味

    哈希算法的用途

    什么是哈希算法 一说到哈希算法, 我瞬间就想到了哈希函数、哈希表, 其实他们并不是一回事. 简单来说, 哈希算法就是将任意长度的字符串通过计算转换为固定长度的字符串, 不对, 不光字符串, 应该说是将任意长度的二进制串转换为固定长度的二进制串, 这个转换的过程就是哈希算法. 当然, 哈希算法不仅仅只有md5这一种, 以用途来分析哈希算法, 就不说哈希算法的原理了, 因为我不会. 1. 可以用哈希算法对文件进行计算, 然后比较哈希值是否相同. 决定将文件存储到哪台服务器, 就可以通过哈希算法取模的操作来得到.

    2.1K70发布于 2019-07-25
  • 来自专栏木木玲

    小白入门——哈希算法

    哈希 哈希(Hash)也称为散列,就是把任意长度的输入,通过散列算法,变换成固定长度的输出,这个输出值就是散列值。 散列表是算法在时间和空间上作出权衡的经典例子 如果没有内存限制,我们可以直接将键作为(可能是一个超大的)数组的索引,那么所有查找操作只需要访问内存一次即可完成。 事实上,我们不必重写代码,只需要调整散列算法的参数就可以在空间和时间之间作出取舍。我们会使用概率论的经典结论来帮组我们选择适当的参数。 使用Hash的查询算法分为两步: ① 用Hash函数将被查找的键转化为数组的一个索引。 理想情况下,不同的键都能转化为不同的索引值。 参考: Multiplication Method Fibonacci Hashing 《算法 第4版》

    1.4K20发布于 2019-06-15
  • 来自专栏全栈程序员必看

    哈希算法 数据结构_实现哈希表构造和查找算法

    一、什么是哈希表 1.概述 哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构。 ,也就是元素在l中的下标 2.为什么哈希表查询速度快 理解了哈希表的基本思路,我们也就不难理解为什么哈希表查询效率高了: 由于每个元素都能通过哈希函数直接计算获得地址,所以查找消耗时间非常少。 举个例子: 我们有哈希函数f(n)=n%3,现有元素{1,2,3},我们使用哈希函数分别获得其哈希值,并把哈希值作为下标存入一个数组, 也就是放f(1)=1,f(2)=2,f(3)=0,如果使用传统线性查找 3.哈希冲突 按照上文的例子,数列{1,2,3}通过哈希函数f(n)=n%3可以计算出哈希值,但是如果出现两个元素的哈希值相同就会出现哈希冲突, 比如f(1)和f(4)都会算出1,这个时候显然不可能上上面一样通过一个一维数组直接存储 /** * @Author:黄成兴 * @Date:2020-07-04 11:36 * @Description:哈希表 */ public class HashTable { /

    90220编辑于 2022-09-23
  • 来自专栏全栈程序员必看

    哈希和一致性哈希算法

    哈希 Hash 算法介绍 哈希算法也叫散列算法, 不过英文单词都是 Hash, 简单一句话概括, 就是可以把任意长度的输入信息通过算法变换成固定长度的输出信息, 输出信息也就是哈希值, 通常哈希值的格式是 , 所以Hash算法广泛应用在现代密码体系中•无碰撞 不同的信息进行哈希后得到的值应该是不同的, 但是从理论上来说, 哈希算法其实是有可能发生碰撞的, 输入的信息是无穷的, 而输出的哈希值长度是固定的, 好比要把10个苹果放到9个抽屉里面, 肯定会有一个抽屉装了多个苹果, 只不过哈希算法的碰撞的概率是非常小的, 比如128位的哈希值, 就有2的128次方的空间。 •效率高 在处理比较大的原生值时, 也能能快速的计算出哈希值•无规律 原始输入信息修改一点信息, 得到的哈希值也是大不相同的 哈希算法的实现有很多, 常见的有 MD5, SHA-1, 还有像 C#, Java 上面的一致性Hash算法其实是经典的哈希算法, 当然还有其他的算法, 比如跳跃一致性哈希法, 有兴趣也可以看一下, 以上内容均为个人理解, 如果错误, 可以指出, 希望对您有用!

    63530编辑于 2022-09-18
  • 来自专栏历史专栏

    【愚公系列】2023年11月 七大查找算法(六)-哈希查找

    一、哈希查找1.基本思想哈希查找算法的基本思想是将关键字通过哈希函数映射为一个索引值,然后在索引值对应的桶或者链表中查找目标元素。 具体地说,哈希查找算法包含两个过程:哈希函数:将关键字映射为一个索引值。 哈希查找算法的时间复杂度是O(1),但是在处理哈希冲突时,需要进行一定的额外操作,如开放地址法、链地址法等,会导致时间复杂度变高。因此,在设计哈希函数时,需要综合考虑哈希函数的效率和冲突处理方法。 但是,由于哈希表可以实现O(1)的查找时间,因此在空间可以承受的情况下,哈希查找算法是一种非常高效的查找算法。 3.应用场景哈希查找算法主要适用于以下场景:查找速度要求高,数据量大的情况下,哈希表的平均查找时间复杂度为O(1),相比于其他查找算法有较大优势。

    49511编辑于 2023-11-19
  • 来自专栏NFT链游的应用

    哈希算法:竞猜逻辑哈希游戏开发的应用

    简单来说,哈希函数就是快速的将1个数值转换为1个哈希值,哈希值是整数,并且要保证,相同的输入得到的哈希值是一样的,如果两个不同的输入得到了相同的结果,这就是哈希值冲突。 也就是说,输入键(key),然后经过哈希函数计算,最后得到哈希值,而哈希值是整数,通过哈希值当做数组下标,得到对应的值。  输入key,经过哈希函数计算fun(key),最后得到y。 按照这种思想,采用哈希技术将值存储在一块连续的存储空间中,这块连续的存储空间称为哈希表或者散列表。关键字对应的存储位置称为哈希地址或者散列地址。  区块链哈希是什么? 每一个区块,包含的内容有数据信息,本区块的哈希值以及上一个区块的哈希值。区块中的数据信息,主要是交易双方的地址与此次交易数量还有交易时间信息等。 而哈希值就是寻找到区块,继而了解到这些区块信息的钥匙。  

    53720编辑于 2022-06-16
  • 来自专栏学习

    【redis】集群 数据分片算法哈希求余、一致性哈希哈希槽分区算法

    每块数据都称为是一个“分片”(上图的每个红框) 哈希求余 借鉴了哈希表的基本思想。 quote] MD5 算法 其本身就是一个计算 hash 值的算法,针对一个字符串,里面的内容进行一系列的数学变换,得到的是一个十六进制的数字 MD5 计算结果是定长的;无论输入的原字符串多长,最终算出的结果就是固定长度 哈希槽分区算法 redis 真正采用的分片算法 hash_slot crc16(key) % 16384 crc16 是一种 hash 值的算法 16384 是 16 * 1024 => 2^14(16KB ) hash_slot 是哈希槽 相当于是把整个哈希值,映射到 16384 个槽位上,也就是 [0, 16383],然后再把这些槽位比较均匀的分配给每个分片上,每个分片的节点都需要记录自己持有哪些分片 此时这三个分片上的数据就是比较均匀的了 这种算法,本质就是把一致性哈希哈希求余这两种方法结合了一下 上面只是一种可能的分片方式,实际上分片是非常灵活的。

    1.1K10编辑于 2025-03-28
  • 来自专栏数据和云

    算法分析:Oracle 11g 中基于哈希算法对唯一值数(NDV)的估算

    2 新 NDV 算法介绍 在11g中,采用了一种新的算法消除 NDV 计算时,数据量与 PGA 消耗之间的线性关系,从而使得通过完全扫描表获得精确统计数据成为可能。 因此,在 11g,自动采样模式下不再进行快速取样,而是直接进行全表扫描获取统计数据。这一新算法称为唯一值数估计(Approximate NDV)。 注意:11g 中,对分区表全局统计数据的增量(INCREMENTAL)计算方式,也是利用了该算法。 3 新NDV算法过程 该算法充分利用了哈希算法的分布均衡特性。 其基本算法过程如下: 它将每个扫描到的数值通过哈希算法转换为一个二进制数值,并放入一个数据结构中,我们称该数据结构为一个纲要(synopsis); 扫描下一个数值,获取到其哈希二进制数值,将其与纲要中已有哈希值比较 ,如果已经存在相同值,则丢弃该值,否则就插入纲要中; 纲要是有大小限制的,当新插入哈希值时,纲要已经达到大小限制,则按照一定规则分裂该纲要、并丢弃其中一份数据(例如,将首位为0的数值丢弃掉),此时,纲要级别也相应增加

    1.7K70发布于 2018-03-29
  • 来自专栏数据库新发现

    算法分析:Oracle 11g 中基于哈希算法对唯一值数(NDV)的估算

    2、新 NDV 算法介绍 在11g中,采用了一种新的算法消除 NDV 计算时,数据量与 PGA 消耗之间的线性关系,从而使得通过完全扫描表获得精确统计数据成为可能。 因此,在 11g,自动采样模式下不再进行快速取样,而是直接进行全表扫描获取统计数据。这一新算法称为唯一值数估计(Approximate NDV)。 注意:11g 中,对分区表全局统计数据的增量(INCREMENTAL)计算方式,也是利用了该算法。 3、新NDV算法过程 该算法充分利用了哈希算法的分布均衡特性。 其基本算法过程如下: 它将每个扫描到的数值通过哈希算法转换为一个二进制数值,并放入一个数据结构中,我们称该数据结构为一个纲要(synopsis); 扫描下一个数值,获取到其哈希二进制数值,将其与纲要中已有哈希值比较 ,如果已经存在相同值,则丢弃该值,否则就插入纲要中; 纲要是有大小限制的,当新插入哈希值时,纲要已经达到大小限制,则按照一定规则分裂该纲要、并丢弃其中一份数据(例如,将首位为0的数值丢弃掉),此时,纲要级别也相应增加

    1.7K30发布于 2019-05-26
领券