您好,登錄后才能下訂單哦!
如何分析HashMap基礎(chǔ)和實(shí)踐,很多新手對(duì)此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來學(xué)習(xí)下,希望你能有所收獲。
HashMap是面試中經(jīng)常問到的一個(gè)知識(shí)點(diǎn),也是判斷一個(gè)候選人基礎(chǔ)是否扎實(shí)的標(biāo)準(zhǔn)之一,因?yàn)橥ㄟ^HashMap可以引出很多知識(shí)點(diǎn),比如數(shù)據(jù)結(jié)構(gòu)(數(shù)組、鏈表、紅黑樹)、equals和hashcode方法,除此之外還可以引出線程安全的問題,HashMap是我在初學(xué)階段學(xué)到的設(shè)計(jì)的最為巧妙的集合,里面有很多細(xì)節(jié)以及優(yōu)化技巧都值得我們深入學(xué)習(xí),本文將會(huì)涉及到以下問題
默認(rèn)大小、負(fù)載因子以及擴(kuò)容倍數(shù)
底層數(shù)據(jù)結(jié)構(gòu)
如何處理hash沖突
如何計(jì)算key的hash值
數(shù)組長(zhǎng)度為什么是2的冪次方
查找、插入、擴(kuò)容過程
fail-fast機(jī)制
如果上面的都能回答出來的話那么這篇文章可能不太適合你,話不多說進(jìn)入正文。
注意:本文源碼都是以JDK1.8版本講解
在 JDK1.8 中,HashMap 是由 數(shù)組+鏈表+紅黑樹構(gòu)成(1.7版本是數(shù)組+鏈表)
當(dāng)一個(gè)值中要存儲(chǔ)到HashMap中的時(shí)候會(huì)根據(jù)Key的值來計(jì)算出他的hash,通過hash值來確認(rèn)存放到數(shù)組中的位置,如果發(fā)生hash沖突就以鏈表的形式存儲(chǔ),當(dāng)鏈表過長(zhǎng)的話,HashMap會(huì)把這個(gè)鏈表轉(zhuǎn)換成紅黑樹來存儲(chǔ),如圖所示:
在看源碼之前我們需要先看看一些基本屬性
//默認(rèn)初始容量為16 static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; //默認(rèn)負(fù)載因子為0.75 static final float DEFAULT_LOAD_FACTOR = 0.75f; //Hash數(shù)組(在resize()中初始化) transient Node<K,V>[] table; //元素個(gè)數(shù) transient int size; //容量閾值(元素個(gè)數(shù)大于等于該值時(shí)會(huì)自動(dòng)擴(kuò)容) int threshold;
table數(shù)組里面存放的是Node對(duì)象,Node是HashMap的一個(gè)內(nèi)部類,用來表示一個(gè)key-value,源碼如下:
static class Node<K,V> implements Map.Entry<K,V> { final int hash; final K key; V value; Node<K,V> next; Node(int hash, K key, V value, Node<K,V> next) { this.hash = hash; this.key = key; this.value = value; this.next = next; } public final K getKey() { return key; } public final V getValue() { return value; } public final String toString() { return key + "=" + value; } public final int hashCode() { return Objects.hashCode(key) ^ Objects.hashCode(value);//^表示相同返回0,不同返回1 //Objects.hashCode(o)————>return o != null ? o.hashCode() : 0; } public final V setValue(V newValue) { V oldValue = value; value = newValue; return oldValue; } public final boolean equals(Object o) { if (o == this) return true; if (o instanceof Map.Entry) { Map.Entry<?,?> e = (Map.Entry<?,?>)o; //Objects.equals(1,b)————> return (a == b) || (a != null && a.equals(b)); if (Objects.equals(key, e.getKey()) && Objects.equals(value, e.getValue())) return true; } return false; } }
總結(jié)
默認(rèn)初始容量為16,默認(rèn)負(fù)載因子為0.75
threshold = 數(shù)組長(zhǎng)度 * loadFactor,當(dāng)元素個(gè)數(shù)大于等于threshold(容量閾值)時(shí),HashMap會(huì)進(jìn)行擴(kuò)容操作
table數(shù)組中存放指向鏈表的引用
這里需要注意的一點(diǎn)是table數(shù)組并不是在構(gòu)造方法里面初始化的,它是在resize(擴(kuò)容)方法里進(jìn)行初始化的。
這里說句題外話:可能有刁鉆的面試官會(huì)問為什么默認(rèn)初始容量要設(shè)置為16?為什么負(fù)載因子要設(shè)置為0.75?
我們都知道HashMap數(shù)組長(zhǎng)度被設(shè)計(jì)成2的冪次方(下面會(huì)講),那為什么初始容量不設(shè)計(jì)成4、8或者32....其實(shí)這是JDK設(shè)計(jì)者經(jīng)過權(quán)衡之后得出的一個(gè)比較合理的數(shù)字,,如果默認(rèn)容量是8的話,當(dāng)添加到第6個(gè)元素的時(shí)候就會(huì)觸發(fā)擴(kuò)容操作,擴(kuò)容操作是非常消耗CPU的,32的話如果只添加少量元素則會(huì)浪費(fèi)內(nèi)存,因此設(shè)計(jì)成16是比較合適的,負(fù)載因子也是同理。
眾所周知,HashMap數(shù)組長(zhǎng)度永遠(yuǎn)為2的冪次方(指的是table數(shù)組的大小),那你有想過為什么嗎?
首先我們需要知道HashMap是通過一個(gè)名為tableSizeFor的方法來確保HashMap數(shù)組長(zhǎng)度永遠(yuǎn)為2的冪次方的,源碼如下:
/*找到大于或等于 cap 的最小2的冪,用來做容量閾值*/ static final int tableSizeFor(int cap) { int n = cap - 1; n |= n >>> 1; n |= n >>> 2; n |= n >>> 4; n |= n >>> 8; n |= n >>> 16; return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1; }
tableSizeFor的功能(不考慮大于最大容量的情況)是返回大于等于輸入?yún)?shù)且最近的2的整數(shù)次冪的數(shù)。比如10,則返回16。
該算法讓最高位的1后面的位全變?yōu)?。最后再讓結(jié)果n+1,即得到了2的整數(shù)次冪的值了。
讓cap-1再賦值給n的目的是另找到的目標(biāo)值大于或等于原值。例如二進(jìn)制1000,十進(jìn)制數(shù)值為8。如果不對(duì)它減1而直接操作,將得到答案10000,即16。顯然不是結(jié)果。減1后二進(jìn)制為111,再進(jìn)行操作則會(huì)得到原來的數(shù)值1000,即8。通過一系列位運(yùn)算大大提高效率。
那在什么地方會(huì)用到tableSizeFor方法呢?
答案就是在構(gòu)造方法里面調(diào)用該方法來設(shè)置threshold,也就是容量閾值。
這里你可能又會(huì)有一個(gè)疑問:為什么要設(shè)置為threshold呢?
因?yàn)樵跀U(kuò)容方法里第一次初始化table數(shù)組時(shí)會(huì)將threshold設(shè)置數(shù)組的長(zhǎng)度,后續(xù)在講擴(kuò)容方法時(shí)再介紹。
/*傳入初始容量和負(fù)載因子*/ public HashMap(int initialCapacity, float loadFactor) { if (initialCapacity < 0) throw new IllegalArgumentException("Illegal initial capacity: " +initialCapacity); if (initialCapacity > MAXIMUM_CAPACITY) initialCapacity = MAXIMUM_CAPACITY; if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal load factor: " +loadFactor); this.loadFactor = loadFactor; this.threshold = tableSizeFor(initialCapacity); }
我個(gè)人覺得這樣設(shè)計(jì)有以下幾個(gè)好處:
1、當(dāng)數(shù)組長(zhǎng)度為2的冪次方時(shí),可以使用位運(yùn)算來計(jì)算元素在數(shù)組中的下標(biāo)
HashMap是通過index=hash&(table.length-1)這條公式來計(jì)算元素在table數(shù)組中存放的下標(biāo),就是把元素的hash值和數(shù)組長(zhǎng)度減1的值做一個(gè)與運(yùn)算,即可求出該元素在數(shù)組中的下標(biāo),這條公式其實(shí)等價(jià)于hash%length,也就是對(duì)數(shù)組長(zhǎng)度求模取余,只不過只有當(dāng)數(shù)組長(zhǎng)度為2的冪次方時(shí),hash&(length-1)才等價(jià)于hash%length,使用位運(yùn)算可以提高效率。
2、 增加hash值的隨機(jī)性,減少hash沖突
如果 length 為 2 的冪次方,則 length-1 轉(zhuǎn)化為二進(jìn)制必定是 11111……的形式,這樣的話可以使所有位置都能和元素hash值做與運(yùn)算,如果是如果 length 不是2的次冪,比如length為15,則length-1為14,對(duì)應(yīng)的二進(jìn)制為1110,在和hash 做與運(yùn)算時(shí),最后一位永遠(yuǎn)都為0 ,浪費(fèi)空間。
HashMap每次擴(kuò)容都是建立一個(gè)新的table數(shù)組,長(zhǎng)度和容量閾值都變?yōu)樵瓉淼膬杀?,然后把原?shù)組元素重新映射到新數(shù)組上,具體步驟如下:
首先會(huì)判斷table數(shù)組長(zhǎng)度,如果大于0說明已被初始化過,那么按當(dāng)前table數(shù)組長(zhǎng)度的2倍進(jìn)行擴(kuò)容,閾值也變?yōu)樵瓉淼?倍
若table數(shù)組未被初始化過,且threshold(閾值)大于0說明調(diào)用了HashMap(initialCapacity, loadFactor)構(gòu)造方法,那么就把數(shù)組大小設(shè)為threshold
若table數(shù)組未被初始化,且threshold為0說明調(diào)用HashMap()構(gòu)造方法,那么就把數(shù)組大小設(shè)為16,threshold設(shè)為16*0.75
接著需要判斷如果不是第一次初始化,那么擴(kuò)容之后,要重新計(jì)算鍵值對(duì)的位置,并把它們移動(dòng)到合適的位置上去,如果節(jié)點(diǎn)是紅黑樹類型的話則需要進(jìn)行紅黑樹的拆分。
這里有一個(gè)需要注意的點(diǎn)就是在JDK1.8 HashMap擴(kuò)容階段重新映射元素時(shí)不需要像1.7版本那樣重新去一個(gè)個(gè)計(jì)算元素的hash值,而是通過hash & oldCap的值來判斷,若為0則索引位置不變,不為0則新索引=原索引+舊數(shù)組長(zhǎng)度,為什么呢?具體原因如下:
因?yàn)槲覀兪褂玫氖?次冪的擴(kuò)展(指長(zhǎng)度擴(kuò)為原來2倍),所以,元素的位置要么是在原位置,要么是在原位置再移動(dòng)2次冪的位置。因此,我們?cè)跀U(kuò)充HashMap的時(shí)候,不需要像JDK1.7的實(shí)現(xiàn)那樣重新計(jì)算hash,只需要看看原來的hash值新增的那個(gè)bit是1還是0就好了,是0的話索引沒變,是1的話索引變成“原索引+oldCap
這點(diǎn)其實(shí)也可以看做長(zhǎng)度為2的冪次方的一個(gè)好處,也是HashMap 1.7和1.8之間的一個(gè)區(qū)別,具體源碼如下:
/*擴(kuò)容*/ final Node<K,V>[] resize() { Node<K,V>[] oldTab = table; int oldCap = (oldTab == null) ? 0 : oldTab.length; int oldThr = threshold; int newCap, newThr = 0; //1、若oldCap>0 說明hash數(shù)組table已被初始化 if (oldCap > 0) { if (oldCap >= MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return oldTab; }//按當(dāng)前table數(shù)組長(zhǎng)度的2倍進(jìn)行擴(kuò)容,閾值也變?yōu)樵瓉淼?倍 else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; }//2、若數(shù)組未被初始化,而threshold>0說明調(diào)用了HashMap(initialCapacity)和HashMap(initialCapacity, loadFactor)構(gòu)造器 else if (oldThr > 0) newCap = oldThr;//新容量設(shè)為數(shù)組閾值 else { //3、若table數(shù)組未被初始化,且threshold為0說明調(diào)用HashMap()構(gòu)造方法 newCap = DEFAULT_INITIAL_CAPACITY;//默認(rèn)為16 newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);//16*0.75 } //若計(jì)算過程中,閾值溢出歸零,則按閾值公式重新計(jì)算 if (newThr == 0) { float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } threshold = newThr; //創(chuàng)建新的hash數(shù)組,hash數(shù)組的初始化也是在這里完成的 Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab; //如果舊的hash數(shù)組不為空,則遍歷舊數(shù)組并映射到新的hash數(shù)組 if (oldTab != null) { for (int j = 0; j < oldCap; ++j) { Node<K,V> e; if ((e = oldTab[j]) != null) { oldTab[j] = null;//GC if (e.next == null)//如果只鏈接一個(gè)節(jié)點(diǎn),重新計(jì)算并放入新數(shù)組 newTab[e.hash & (newCap - 1)] = e; //若是紅黑樹,則需要進(jìn)行拆分 else if (e instanceof TreeNode) ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); else { //rehash————>重新映射到新數(shù)組 Node<K,V> loHead = null, loTail = null; Node<K,V> hiHead = null, hiTail = null; Node<K,V> next; do { next = e.next; /*注意這里使用的是:e.hash & oldCap,若為0則索引位置不變,不為0則新索引=原索引+舊數(shù)組長(zhǎng)度*/ if ((e.hash & oldCap) == 0) { if (loTail == null) loHead = e; else loTail.next = e; loTail = e; } else { if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); if (loTail != null) { loTail.next = null; newTab[j] = loHead; } if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; } } } } } return newTab; }
在擴(kuò)容方法里面還涉及到有關(guān)紅黑樹的幾個(gè)知識(shí)點(diǎn):
指的就是把鏈表轉(zhuǎn)換成紅黑樹,樹化需要滿足以下兩個(gè)條件:
鏈表長(zhǎng)度大于等于8
table數(shù)組長(zhǎng)度大于等于64
為什么table數(shù)組容量大于等于64才樹化?
因?yàn)楫?dāng)table數(shù)組容量比較小時(shí),鍵值對(duì)節(jié)點(diǎn) hash 的碰撞率可能會(huì)比較高,進(jìn)而導(dǎo)致鏈表長(zhǎng)度較長(zhǎng)。這個(gè)時(shí)候應(yīng)該優(yōu)先擴(kuò)容,而不是立馬樹化。
拆分就是指擴(kuò)容后對(duì)元素重新映射時(shí),紅黑樹可能會(huì)被拆分成兩條鏈表。
由于篇幅有限,有關(guān)紅黑樹這里就不展開了。
在看源碼之前先來簡(jiǎn)單梳理一下查找流程:
首先通過自定義的hash方法計(jì)算出key的hash值,求出在數(shù)組中的位置
判斷該位置上是否有節(jié)點(diǎn),若沒有則返回null,代表查詢不到指定的元素
若有則判斷該節(jié)點(diǎn)是不是要查找的元素,若是則返回該節(jié)點(diǎn)
若不是則判斷節(jié)點(diǎn)的類型,如果是紅黑樹的話,則調(diào)用紅黑樹的方法去查找元素
如果是鏈表類型,則遍歷鏈表調(diào)用equals方法去查找元素
HashMap的查找是非??斓?,要查找一個(gè)元素首先得知道key的hash值,在HashMap中并不是直接通過key的hashcode方法獲取哈希值,而是通過內(nèi)部自定義的hash方法計(jì)算哈希值,我們來看看其實(shí)現(xiàn):
static final int hash(Object key) { int h; return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); }
(h = key.hashCode()) ^ (h >>> 16) 是為了讓高位數(shù)據(jù)與低位數(shù)據(jù)進(jìn)行異或,變相的讓高位數(shù)據(jù)參與到計(jì)算中,int有 32 位,右移16位就能讓低16位和高16位進(jìn)行異或,也是為了增加hash值的隨機(jī)性。
知道如何計(jì)算hash值后我們來看看get方法
public V get(Object key) { Node<K,V> e; return (e = getNode(hash(key), key)) == null ? null : e.value;//hash(key)不等于key.hashCode } final Node<K,V> getNode(int hash, Object key) { Node<K,V>[] tab; //指向hash數(shù)組 Node<K,V> first, e; //first指向hash數(shù)組鏈接的第一個(gè)節(jié)點(diǎn),e指向下一個(gè)節(jié)點(diǎn) int n;//hash數(shù)組長(zhǎng)度 K k; /*(n - 1) & hash ————>根據(jù)hash值計(jì)算出在數(shù)組中的索引index(相當(dāng)于對(duì)數(shù)組長(zhǎng)度取模,這里用位運(yùn)算進(jìn)行了優(yōu)化)*/ if ((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null) { //基本類型用==比較,其它用equals比較 if (first.hash == hash && ((k = first.key) == key || (key != null && key.equals(k)))) return first; if ((e = first.next) != null) { //如果first是TreeNode類型,則調(diào)用紅黑樹查找方法 if (first instanceof TreeNode) return ((TreeNode<K,V>)first).getTreeNode(hash, key); do {//向后遍歷 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) return e; } while ((e = e.next) != null); } } return null; }
這里要注意的一點(diǎn)就是在HashMap中用 (n - 1) & hash 計(jì)算key所對(duì)應(yīng)的索引index(相當(dāng)于對(duì)數(shù)組長(zhǎng)度取模,這里用位運(yùn)算進(jìn)行了優(yōu)化),這點(diǎn)在上面已經(jīng)說過了,就不再?gòu)U話了。
我們先來看看插入元素的步驟:
當(dāng)table數(shù)組為空時(shí),通過擴(kuò)容的方式初始化table
通過計(jì)算鍵的hash值求出下標(biāo)后,若該位置上沒有元素(沒有發(fā)生hash沖突),則新建Node節(jié)點(diǎn)插入
若發(fā)生了hash沖突,遍歷鏈表查找要插入的key是否已經(jīng)存在,存在的話根據(jù)條件判斷是否用新值替換舊值
如果不存在,則將元素插入鏈表尾部,并根據(jù)鏈表長(zhǎng)度決定是否將鏈表轉(zhuǎn)為紅黑樹
判斷鍵值對(duì)數(shù)量是否大于等于閾值,如果是的話則進(jìn)行擴(kuò)容操作
先看完上面的流程,再來看源碼會(huì)簡(jiǎn)單很多,源碼如下:
public V put(K key, V value) { return putVal(hash(key), key, value, false, true); } final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) { Node<K,V>[] tab;//指向hash數(shù)組 Node<K,V> p;//初始化為table中第一個(gè)節(jié)點(diǎn) int n, i;//n為數(shù)組長(zhǎng)度,i為索引 //tab被延遲到插入新數(shù)據(jù)時(shí)再進(jìn)行初始化 if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; //如果數(shù)組中不包含Node引用,則新建Node節(jié)點(diǎn)存入數(shù)組中即可 if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null);//new Node<>(hash, key, value, next) else { Node<K,V> e; //如果要插入的key-value已存在,用e指向該節(jié)點(diǎn) K k; //如果第一個(gè)節(jié)點(diǎn)就是要插入的key-value,則讓e指向第一個(gè)節(jié)點(diǎn)(p在這里指向第一個(gè)節(jié)點(diǎn)) if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) e = p; //如果p是TreeNode類型,則調(diào)用紅黑樹的插入操作(注意:TreeNode是Node的子類) else if (p instanceof TreeNode) e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); else { //對(duì)鏈表進(jìn)行遍歷,并用binCount統(tǒng)計(jì)鏈表長(zhǎng)度 for (int binCount = 0; ; ++binCount) { //如果鏈表中不包含要插入的key-value,則將其插入到鏈表尾部 if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); //如果鏈表長(zhǎng)度大于或等于樹化閾值,則進(jìn)行樹化操作 if (binCount >= TREEIFY_THRESHOLD - 1) treeifyBin(tab, hash); break; } //如果要插入的key-value已存在則終止遍歷,否則向后遍歷 if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } //如果e不為null說明要插入的key-value已存在 if (e != null) { V oldValue = e.value; //根據(jù)傳入的onlyIfAbsent判斷是否要更新舊值 if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue; } } ++modCount; //鍵值對(duì)數(shù)量大于等于閾值時(shí),則進(jìn)行擴(kuò)容 if (++size > threshold) resize(); afterNodeInsertion(evict);//也是空函數(shù)?回調(diào)?不知道干嘛的 return null; }
從源碼也可以看出table數(shù)組是在第一次調(diào)用put方法后才進(jìn)行初始化的。
這里還有一個(gè)知識(shí)點(diǎn)就是在JDK1.8版本HashMap是在鏈表尾部插入元素的,而在1.7版本里是插入鏈表頭部的,1.7版本這么設(shè)計(jì)的原因可能是作者認(rèn)為新插入的元素使用到的頻率會(huì)比較高,插入頭部的話可以減少遍歷次數(shù)。
那為什么1.8改成尾插法了呢?主要是因?yàn)轭^插法在多線程環(huán)境下可能會(huì)導(dǎo)致兩個(gè)節(jié)點(diǎn)互相引用,形成死循環(huán),由于此文主要講解1.8版本,感興趣的小伙伴可以去看看1.7版本的源碼。
HashMap的刪除操作并不復(fù)雜,僅需三個(gè)步驟即可完成。
定位桶位置
遍歷鏈表找到相等的節(jié)點(diǎn)
第三步刪除節(jié)點(diǎn)
public V remove(Object key) { Node<K,V> e; return (e = removeNode(hash(key), key, null, false, true)) == null ? null : e.value; } final Node<K,V> removeNode(int hash, Object key, Object value,boolean matchValue, boolean movable) { Node<K,V>[] tab; Node<K,V> p; int n, index; //1、定位元素桶位置 if ((tab = table) != null && (n = tab.length) > 0 && (p = tab[index = (n - 1) & hash]) != null) { Node<K,V> node = null, e; K k; V v; // 如果鍵的值與鏈表第一個(gè)節(jié)點(diǎn)相等,則將 node 指向該節(jié)點(diǎn) if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k)))) node = p; else if ((e = p.next) != null) { // 如果是 TreeNode 類型,調(diào)用紅黑樹的查找邏輯定位待刪除節(jié)點(diǎn) if (p instanceof TreeNode) node = ((TreeNode<K,V>)p).getTreeNode(hash, key); else { // 2、遍歷鏈表,找到待刪除節(jié)點(diǎn) do { if (e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))) { node = e; break; } p = e; } while ((e = e.next) != null); } } // 3、刪除節(jié)點(diǎn),并修復(fù)鏈表或紅黑樹 if (node != null && (!matchValue || (v = node.value) == value || (value != null && value.equals(v)))) { if (node instanceof TreeNode) ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable); else if (node == p) tab[index] = node.next; else p.next = node.next; ++modCount; --size; afterNodeRemoval(node); return node; } } return null; }
注意:刪除節(jié)點(diǎn)后可能破壞了紅黑樹的平衡性質(zhì),removeTreeNode方法會(huì)對(duì)紅黑樹進(jìn)行變色、旋轉(zhuǎn)等操作來保持紅黑樹的平衡結(jié)構(gòu),這部分比較復(fù)雜,感興趣的小伙伴可看下面這篇文章:紅黑樹詳解
在工作中HashMap的遍歷操作也是非常常用的,也許有很多小伙伴喜歡用for-each來遍歷,但是你知道其中有哪些坑嗎?
看下面的例子,當(dāng)我們?cè)诒闅vHashMap的時(shí)候,若使用remove方法刪除元素時(shí)會(huì)拋出ConcurrentModificationException異常
Map<String, Integer> map = new HashMap<>(); map.put("1", 1); map.put("2", 2); map.put("3", 3); for (String s : map.keySet()) { if (s.equals("2")) map.remove("2"); }
這就是常說的fail-fast(快速失敗)機(jī)制,這個(gè)就需要從一個(gè)變量說起
transient int modCount;
在HashMap中有一個(gè)名為modCount的變量,它用來表示集合被修改的次數(shù),修改指的是插入元素或刪除元素,可以回去看看上面插入刪除的源碼,在最后都會(huì)對(duì)modCount進(jìn)行自增。
當(dāng)我們?cè)诒闅vHashMap時(shí),每次遍歷下一個(gè)元素前都會(huì)對(duì)modCount進(jìn)行判斷,若和原來的不一致說明集合結(jié)果被修改過了,然后就會(huì)拋出異常,這是Java集合的一個(gè)特性,我們這里以keySet為例,看看部分相關(guān)源碼:
public Set<K> keySet() { Set<K> ks = keySet; if (ks == null) { ks = new KeySet(); keySet = ks; } return ks; } final class KeySet extends AbstractSet<K> { public final Iterator<K> iterator() { return new KeyIterator(); } // 省略部分代碼 } final class KeyIterator extends HashIterator implements Iterator<K> { public final K next() { return nextNode().key; } } /*HashMap迭代器基類,子類有KeyIterator、ValueIterator等*/ abstract class HashIterator { Node<K,V> next; //下一個(gè)節(jié)點(diǎn) Node<K,V> current; //當(dāng)前節(jié)點(diǎn) int expectedModCount; //修改次數(shù) int index; //當(dāng)前索引 //無(wú)參構(gòu)造 HashIterator() { expectedModCount = modCount; Node<K,V>[] t = table; current = next = null; index = 0; //找到第一個(gè)不為空的桶的索引 if (t != null && size > 0) { do {} while (index < t.length && (next = t[index++]) == null); } } //是否有下一個(gè)節(jié)點(diǎn) public final boolean hasNext() { return next != null; } //返回下一個(gè)節(jié)點(diǎn) final Node<K,V> nextNode() { Node<K,V>[] t; Node<K,V> e = next; if (modCount != expectedModCount) throw new ConcurrentModificationException();//fail-fast if (e == null) throw new NoSuchElementException(); //當(dāng)前的鏈表遍歷完了就開始遍歷下一個(gè)鏈表 if ((next = (current = e).next) == null && (t = table) != null) { do {} while (index < t.length && (next = t[index++]) == null); } return e; } //刪除元素 public final void remove() { Node<K,V> p = current; if (p == null) throw new IllegalStateException(); if (modCount != expectedModCount) throw new ConcurrentModificationException(); current = null; K key = p.key; removeNode(hash(key), key, null, false, false);//調(diào)用外部的removeNode expectedModCount = modCount; } }
相關(guān)代碼如下,可以看到若modCount被修改了則會(huì)拋出ConcurrentModificationException異常。
if (modCount != expectedModCount) throw new ConcurrentModificationException();
那么如何在遍歷時(shí)刪除元素呢?
我們可以看看迭代器自帶的remove方法,其中最后兩行代碼如下:
removeNode(hash(key), key, null, false, false);//調(diào)用外部的removeNode expectedModCount = modCount;
意思就是會(huì)調(diào)用外部remove方法刪除元素后,把modCount賦值給expectedModCount,這樣的話兩者一致就不會(huì)拋出異常了,所以我們應(yīng)該這樣寫:
Map<String, Integer> map = new HashMap<>(); map.put("1", 1); map.put("2", 2); map.put("3", 3); Iterator<String> iterator = map.keySet().iterator(); while (iterator.hasNext()){ if (iterator.next().equals("2")) iterator.remove(); }
這里還有一個(gè)知識(shí)點(diǎn)就是在遍歷HashMap時(shí),我們會(huì)發(fā)現(xiàn)遍歷的順序和插入的順序不一致,這是為什么?
在HashIterator源碼里面可以看出,它是先從桶數(shù)組中找到包含鏈表節(jié)點(diǎn)引用的桶。然后對(duì)這個(gè)桶指向的鏈表進(jìn)行遍歷。遍歷完成后,再繼續(xù)尋找下一個(gè)包含鏈表節(jié)點(diǎn)引用的桶,找到繼續(xù)遍歷。找不到,則結(jié)束遍歷。這就解釋了為什么遍歷和插入的順序不一致,不懂的同學(xué)請(qǐng)看下圖:
我在面試中就被問到過HashMap的key有什么限制嗎?相信很多人都知道HashMap的key需要重寫equals和hashcode方法。
為什么HashMap的key需要重寫equals()和hashcode()方法?
簡(jiǎn)單看個(gè)例子,這里以Person為例:
public class Person { Integer id; String name; public Person(Integer id, String name) { this.id = id; this.name = name; } @Override public boolean equals(Object obj) { if (obj == null) return false; if (obj == this) return true; if (obj instanceof Person) { Person person = (Person) obj; if (this.id == person.id) return true; } return false; } public static void main(String[] args) { Person p1 = new Person(1, "aaa"); Person p2 = new Person(1, "bbb"); HashMap<Person, String> map = new HashMap<>(); map.put(p1, "這是p1"); System.out.println(map.get(p2)); } }
原生的equals方法是使用==來比較對(duì)象的
原生的hashCode值是根據(jù)內(nèi)存地址換算出來的一個(gè)值
Person類重寫equals方法來根據(jù)id判斷是否相等,當(dāng)沒有重寫hashcode方法時(shí),插入p1后便無(wú)法用p2取出元素,這是因?yàn)閜1和p2的哈希值不相等。
HashMap插入元素時(shí)是根據(jù)元素的哈希值來確定存放在數(shù)組中的位置,因此HashMap的key需要重寫equals和hashcode方法。
看完上述內(nèi)容是否對(duì)您有幫助呢?如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章,請(qǐng)關(guān)注億速云行業(yè)資訊頻道,感謝您對(duì)億速云的支持。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。