如何解讀Java HashMap核心源碼

發(fā)布時(shí)間：2021-12-08 17:36:01 來源：億速云閱讀：101 作者：柒染欄目：編程語言

這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)如何解讀Java HashMap核心源碼，文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述，閱讀完這篇文章希望大家可以有所收獲。

對HashMap實(shí)現(xiàn)的源碼進(jìn)行簡單的分析。所使用的HashMap源碼的版本信息如下：

/*
* @(#)HashMap.java 1.73 07/03/13
*
* Copyright 2006 Sun Microsystems, Inc. All rights reserved.
* SUN PROPRIETARY/CONFIDENTIAL. Use is subject to license terms.
*/

一.概述

在Java中每一個(gè)對象都有一個(gè)哈希碼，這個(gè)值可以通過hashCode()方法獲得。hashCode()的值和對象的equals方法息息相關(guān)，是兩個(gè)對象的值是否相等的依據(jù)，所以當(dāng)我們覆蓋一個(gè)類的equals方法的時(shí)候也必須覆蓋hashCode方法。

例如String的hashCode方法為：

public int hashCode() {
int h = hash;
if (h == 0) {
int off = offset;
char val[] = value;
int len = count;

for (int i = 0; i < len; i++) {
h = 31*h + val[off++];
}
hash = h;
}
return h;
}

可以看得出，一個(gè)字符串的哈希值為s[0]31n-1 + s[1]31n-2 + … + s[n-1]，是一個(gè)整數(shù)。也就是說所有的字符串可以通過hashCode()將其映射到整數(shù)的區(qū)間中，由于在java中整數(shù)的個(gè)數(shù)是有限的（四個(gè)字節(jié)有正負(fù)，***位為符號位-231 ~ 231 -1），當(dāng)s[0]31n-1 + s[1]31n-2 + … + s[n-1]足夠大的時(shí)候可能會溢出，導(dǎo)致其變成負(fù)值。從上面的情況我們可以看出兩個(gè)不同的字符串可能會被映射到同一個(gè)整數(shù)，發(fā)生沖突。因此java的開發(fā)人員選擇了31這個(gè)乘數(shù)因子，盡量使得各個(gè)字符串映射的結(jié)果在整個(gè)java的整數(shù)域內(nèi)均勻分布。

談完java對象的哈希碼，我們來看看今天的主角HashMap，HashMap可以看作是Java實(shí)現(xiàn)的哈希表。HashMap中存放的是 key-value對，對應(yīng)的類型為java.util.HashMap.Entry，所以在HashMap中數(shù)據(jù)都存放在一個(gè)Entry引用類型的數(shù)組 table中。這里key是一個(gè)對象，為了把對象映射到table中的一個(gè)位置，我們可以通過求余法來，所以我們可以使用 [key的hashCode % table的長度]來計(jì)算位置（當(dāng)然在實(shí)際操作的時(shí)候由于需要考慮table上的key的均勻分布可能需要對key的hashCode做一些處理）。

二.源碼解析

相關(guān)屬性首先肯定是需要一個(gè)數(shù)組table，作為數(shù)據(jù)結(jié)構(gòu)的骨干。

transient Entry[] table;

這邊定義了一個(gè)Entry數(shù)組的引用。繼續(xù)介紹幾個(gè)概念把

capacity容量是指數(shù)組table的長度
loadFactor 裝載因子，是實(shí)際存放量/capacity容量的一個(gè)比值，在代碼中這個(gè)屬性是描述了裝載因子的***值，默認(rèn)大小為0.75
threshold（閾值）代表hashmap存放內(nèi)容數(shù)量的一個(gè)臨界點(diǎn)，當(dāng)存放量大于這個(gè)值的時(shí)候，就需要將table進(jìn)行夸張，也就是新建一個(gè)兩倍大的數(shù)組，并將老的元素轉(zhuǎn)移過去。threshold = (int)(capacity * loadFactor);

put方法詳解

public V put(K key, V value) {
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key.hashCode());
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

在HashMap中我們的key可以為null，所以***步就處理了key為null的情況。
當(dāng)key為非null的時(shí)候，你也許會認(rèn)為：恩，直接和table長度相除取模吧，但是這里沒有，而是又好像做了一次哈希，這是為什么呢？這個(gè)還得先看indexFor(hash, table.length)方法，這個(gè)方法是決定存放位置的

static int indexFor(int h, int length) {
        return h & (length-1);
    }

明眼的都可以發(fā)現(xiàn)，因?yàn)樵贖ashMap中table的長度為2n (我們把運(yùn)算都換成二進(jìn)制進(jìn)行考慮)，所以h & (length-1)就等價(jià)于h%length，這也就是說，如果對原本的hashCode不做變換的話，其除去低length-1位后的部分不會對 key在table中的位置產(chǎn)生任何影響，這樣只要保持低length-1位不變，不管高位如何都會沖突，所以就想辦法使得高位對其結(jié)果也產(chǎn)生影響，于是就對hashCode又做了一次哈希

static int hash(int h) {
        // This function ensures that hashCodes that differ only by
        // constant multiples at each bit position have a bounded
        // number of collisions (approximately 8 at default load factor).
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

當(dāng)找到key所對應(yīng)的位置的時(shí)候，對對應(yīng)位置的Entry的鏈表進(jìn)行遍歷，如果以及存在key的話，就更新對應(yīng)的value，并返回老的 value。如果是新的key的話，就將其增加進(jìn)去。modCount是用來記錄hashmap結(jié)構(gòu)變化的次數(shù)的，這個(gè)在hashmap的fail- fast機(jī)制中需要使用（當(dāng)某一個(gè)線程獲取了map的游標(biāo)之后，另一個(gè)線程對map做了結(jié)構(gòu)修改的操作，那么原先準(zhǔn)備遍歷的線程會拋出異常）。 addEntry的方法如下

void addEntry(int hash, K key, V value, int bucketIndex) {
    Entry<K,V> e = table[bucketIndex];
        table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
        if (size++ >= threshold)
            resize(2 * table.length);
    }

get方法

public V get(Object key) {
        if (key == null)
            return getForNullKey();
        int hash = hash(key.hashCode());
        for (Entry<K,V> e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                return e.value;
        }
        return null;
    }

get方法其實(shí)就是將key以put時(shí)相同的方法算出在table的所在位置，然后對所在位置的鏈表進(jìn)行遍歷，找到hash值和key都相等的Entry并將value返回。

上述就是小編為大家分享的如何解讀Java HashMap核心源碼了，如果剛好有類似的疑惑，不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識，歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

如何解讀Java HashMap核心源碼

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽