一致性 Hash 超通俗讲解

发布时间:2026/6/24 8:58:23
一致性 Hash 超通俗讲解 一、普通哈希分配 KV 有什么致命问题假设我们有 3 台服务器用来存大量 KV 数据节点 A、节点 B、节点 C 常规分配规则公式节点下标 hash(Key) % 总机器数 N举例 N3某个 Key 算出来哈希取模是 0 → 存 A模 1 存 B模 2 存 C。痛点增减一台机器几乎所有数据都要搬家如果再加一台节点 D总机器数 N4 原来所有 Key 取模结果全部变了绝大多数 Key 匹配的服务器全部错乱需要大规模迁移数据系统卡顿、压力巨大。 一致性 Hash 就是专门解决扩容 / 缩容时数据迁移量太大的算法。二、一致性 Hash 核心结构哈希环设定一个固定哈希取值范围0 ~ 2³²−1把首尾连起来形成一个环形哈希空间。第一步把所有真实服务器节点各自算出哈希值摆到圆环对应的位置上。存放 / 查询某个 Key 的规则 ① 计算这个 Key 的哈希值定位到环上一个点 ② 沿着圆环顺时针往前走遇到的第一个服务器节点就是这个 Key 的存放节点。简单举例环上顺时针排布节点A → B → CKey 哈希落在 A~B 区间顺时针找到 B数据存在 BKey 哈希落在 B~C 区间顺时针找到 C数据存在 CKey 哈希落在 C~A 区间顺时针找到 A数据存在 A三、增减节点优势核心优点1、新增节点只影响新增节点逆时针相邻区间里的一部分 Key只有这一小部分数据需要迁移绝大部分 KV 数据不用动。2、某个节点宕机下线下线节点对应的所有 Key会顺延顺时针找下一个节点承接同样只有局部数据迁移不会全局洗牌。对比普通取模哈希普通哈希改总数 全量数据搬迁一致性哈希只有少量数据搬迁。四、一致性 Hash 天生缺陷数据倾斜如果节点在哈希环上分布不均匀有的节点占据圆环很大一段区间存海量数据有的节点区间很小数据很少负载严重不均衡。解决方案虚拟节点给每一台真实物理节点虚拟出成百上千个虚拟节点计算哈希打散均匀散布在整个环上。 寻址逻辑不变Key 找到虚拟节点后再映射回对应的真实机器。 好处数据在多台机器分布更均匀负载均衡某台机器下线数据会分摊给多个后继节点不会瞬间压垮单台服务器。极简总结一致性 Hash 构建 0~2³² 环形哈希空间节点与 Key 映射到环上Key 顺时针匹配首个节点完成存储分配增减节点仅少量数据迁移解决普通哈希扩容大规模数据搬迁问题引入虚拟节点解决数据倾斜、节点负载不均问题作用是 KV 数据分片路由和 Raft 多副本一致性属于不同层面的分布式方案