|
|
@ -4,7 +4,7 @@ comments: true
|
|
|
|
|
|
|
|
|
|
|
|
# 哈希表
|
|
|
|
# 哈希表
|
|
|
|
|
|
|
|
|
|
|
|
哈希表通过建立「键 Key」和「值 Value」之间的映射,实现高效的元素查找。具体地,输入一个 Key ,在哈希表中查询并获取 Value ,时间复杂度为 $O(1)$ 。
|
|
|
|
哈希表通过建立「键 key」和「值 value」之间的映射,实现高效的元素查找。具体地,输入一个 key ,在哈希表中查询并获取 value ,时间复杂度为 $O(1)$ 。
|
|
|
|
|
|
|
|
|
|
|
|
例如,给定一个包含 $n$ 个学生的数据库,每个学生有 "姓名 `name` ” 和 “学号 `id` ” 两项数据,希望实现一个查询功能:**输入一个学号,返回对应的姓名**,则可以使用哈希表实现。
|
|
|
|
例如,给定一个包含 $n$ 个学生的数据库,每个学生有 "姓名 `name` ” 和 “学号 `id` ” 两项数据,希望实现一个查询功能:**输入一个学号,返回对应的姓名**,则可以使用哈希表实现。
|
|
|
|
|
|
|
|
|
|
|
@ -62,15 +62,15 @@ map.remove(10583);
|
|
|
|
|
|
|
|
|
|
|
|
```java
|
|
|
|
```java
|
|
|
|
/* 遍历哈希表 */
|
|
|
|
/* 遍历哈希表 */
|
|
|
|
// 遍历键值对 Key->Value
|
|
|
|
// 遍历键值对 key->value
|
|
|
|
for (Map.Entry <Integer, String> kv: map.entrySet()) {
|
|
|
|
for (Map.Entry <Integer, String> kv: map.entrySet()) {
|
|
|
|
System.out.println(kv.getKey() + " -> " + kv.getValue());
|
|
|
|
System.out.println(kv.getKey() + " -> " + kv.getValue());
|
|
|
|
}
|
|
|
|
}
|
|
|
|
// 单独遍历键 Key
|
|
|
|
// 单独遍历键 key
|
|
|
|
for (int key: map.keySet()) {
|
|
|
|
for (int key: map.keySet()) {
|
|
|
|
System.out.println(key);
|
|
|
|
System.out.println(key);
|
|
|
|
}
|
|
|
|
}
|
|
|
|
// 单独遍历值 Value
|
|
|
|
// 单独遍历值 value
|
|
|
|
for (String val: map.values()) {
|
|
|
|
for (String val: map.values()) {
|
|
|
|
System.out.println(val);
|
|
|
|
System.out.println(val);
|
|
|
|
}
|
|
|
|
}
|
|
|
@ -80,14 +80,14 @@ for (String val: map.values()) {
|
|
|
|
|
|
|
|
|
|
|
|
哈希表中存储元素的数据结构被称为「桶 Bucket」,底层实现可能是数组、链表、二叉树(红黑树),或是它们的组合。
|
|
|
|
哈希表中存储元素的数据结构被称为「桶 Bucket」,底层实现可能是数组、链表、二叉树(红黑树),或是它们的组合。
|
|
|
|
|
|
|
|
|
|
|
|
最简单地,**我们可以仅用一个「数组」来实现哈希表**。首先,将所有 Value 放入数组中,那么每个 Value 在数组中都有唯一的「索引」。显然,访问 Value 需要给定索引,而为了 **建立 Key 和索引之间的映射关系**,我们需要使用「哈希函数 Hash Function」。
|
|
|
|
最简单地,**我们可以仅用一个「数组」来实现哈希表**。首先,将所有 value 放入数组中,那么每个 value 在数组中都有唯一的「索引」。显然,访问 value 需要给定索引,而为了 **建立 key 和索引之间的映射关系**,我们需要使用「哈希函数 Hash Function」。
|
|
|
|
|
|
|
|
|
|
|
|
设数组为 `bucket` ,哈希函数为 `f(x)` ,输入键为 `key` 。那么获取 Value 的步骤为:
|
|
|
|
设数组为 `bucket` ,哈希函数为 `f(x)` ,输入键为 `key` 。那么获取 value 的步骤为:
|
|
|
|
|
|
|
|
|
|
|
|
1. 通过哈希函数计算出索引,即 `index = f(key)` ;
|
|
|
|
1. 通过哈希函数计算出索引,即 `index = f(key)` ;
|
|
|
|
2. 通过索引在数组中获取值,即 `value = bucket[index]` ;
|
|
|
|
2. 通过索引在数组中获取值,即 `value = bucket[index]` ;
|
|
|
|
|
|
|
|
|
|
|
|
以上述学生数据 `Key 学号 -> Value 姓名` 为例,我们可以将「哈希函数」设计为
|
|
|
|
以上述学生数据 `key 学号 -> value 姓名` 为例,我们可以将「哈希函数」设计为
|
|
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
$$
|
|
|
|
f(x) = x \% 100
|
|
|
|
f(x) = x \% 100
|
|
|
@ -151,11 +151,13 @@ class ArrayHashMap {
|
|
|
|
|
|
|
|
|
|
|
|
## 哈希冲突
|
|
|
|
## 哈希冲突
|
|
|
|
|
|
|
|
|
|
|
|
细心的同学可能会发现,**哈希函数 $f(x) = x \% 100$ 会在某些情况下失效**。具体地,当输入的 Key 后两位相同时,哈希函数的计算结果也相同,指向同一个 Value 。例如,分别查询两个学号 12836 和 20336 ,则有
|
|
|
|
细心的同学可能会发现,**哈希函数 $f(x) = x \% 100$ 会在某些情况下失效**。具体地,当输入的 key 后两位相同时,哈希函数的计算结果也相同,指向同一个 value 。例如,分别查询两个学号 12836 和 20336 ,则有
|
|
|
|
|
|
|
|
|
|
|
|
$$
|
|
|
|
$$
|
|
|
|
f(12836) = f(20336) = 36
|
|
|
|
f(12836) = f(20336) = 36
|
|
|
|
$$
|
|
|
|
$$
|
|
|
|
导致两个学号指向了同一个姓名,这明显是不对的。我们将这种现象称为「哈希冲突 Hash Collision」,其会严重影响查询的正确性,我们将如何避免哈希冲突的问题留在下章讨论。
|
|
|
|
|
|
|
|
|
|
|
|
两个学号指向了同一个姓名,这明显是不对的,我们将这种现象称为「哈希冲突 Hash Collision」,其会严重影响查询的正确性。如何避免哈希冲突的问题将被留在下章讨论。
|
|
|
|
|
|
|
|
|
|
|
|
![hash_collision](hash_map.assets/hash_collision.png)
|
|
|
|
![hash_collision](hash_map.assets/hash_collision.png)
|
|
|
|
|
|
|
|
|
|
|
|