HashMap原理的深入理解

發(fā)布時間：2020-09-07 16:41:21 來源：腳本之家閱讀：209 作者：visant 欄目：編程語言

hashing(散列法或哈希法)的概念

散列法（Hashing）是一種將字符組成的字符串轉(zhuǎn)換為固定長度（一般是更短長度）的數(shù)值或索引值的方法，稱為散列法，也叫哈希法。由于通過更短的哈希值比用原始值進(jìn)行數(shù)據(jù)庫搜索更快，這種方法一般用來在數(shù)據(jù)庫中建立索引并進(jìn)行搜索，同時還用在各種解密算法中。

HashMap概念和底層結(jié)構(gòu)

HashMap是基于哈希表的Map接口的非同步實(shí)現(xiàn)。此實(shí)現(xiàn)提供所有可選的映射操作，并允許使用null值和null鍵。HashMap儲存的是鍵值對，HashMap很快。此類不保證映射的順序，特別是它不保證該順序恒久不變。

HashMap實(shí)際上是一個“鏈表散列”的數(shù)據(jù)結(jié)構(gòu)，即數(shù)組和鏈表的結(jié)合體。

數(shù)組：存儲區(qū)間連續(xù)，占用內(nèi)存嚴(yán)重，尋址容易，插入刪除困難；
鏈表：存儲區(qū)間離散，占用內(nèi)存比較寬松，尋址困難，插入刪除容易；
Hashmap綜合應(yīng)用了這兩種數(shù)據(jù)結(jié)構(gòu)，實(shí)現(xiàn)了尋址容易，插入刪除也容易。

hashMap的結(jié)構(gòu)示意圖如下：

HashMap原理的深入理解

HashMap的基本存儲原理以及存儲內(nèi)容的組成

基本原理：先聲明一個下標(biāo)范圍比較大的數(shù)組來存儲元素。另外設(shè)計(jì)一個哈希函數(shù)（也叫做散列函數(shù)）來獲得每一個元素的Key（關(guān)鍵字）的函數(shù)值（即數(shù)組下標(biāo)，hash值）相對應(yīng)，數(shù)組存儲的元素是一個Entry類，這個類有三個數(shù)據(jù)域，key、value（鍵值對），next(指向下一個Entry)。

例如，第一個鍵值對A進(jìn)來。通過計(jì)算其key的hash得到的index=0。記做:Entry[0] = A。
第二個鍵值對B，通過計(jì)算其index也等于0， HashMap會將B.next =A,Entry[0] =B,
第三個鍵值對 C,index也等于0,那么C.next = B,Entry[0] = C；這樣我們發(fā)現(xiàn)index=0的地方事實(shí)上存取了A,B,C三個鍵值對,它們通過next這個屬性鏈接在一起。我們可以將這個地方稱為桶。對于不同的元素，可能計(jì)算出了相同的函數(shù)值，這樣就產(chǎn)生了“沖突”，這就需要解決沖突，“直接定址”與“解決沖突”是哈希表的兩大特點(diǎn)。

HashMap的工作原理以及存取方法過程

HashMap的工作原理：HashMap是基于散列法（又稱哈希法hashing）的原理，使用put(key, value)存儲對象到HashMap中，使用get(key)從HashMap中獲取對象。當(dāng)我們給put()方法傳遞鍵和值時，我們先對鍵調(diào)用hashCode()方法，返回的hashCode用于找到bucket（桶）位置來儲存Entry對象?！盚ashMap是在bucket中儲存鍵對象和值對象，作為Map.Entry。并不是僅僅只在bucket中存儲值。

HashMap具體的存取過程如下：
put鍵值對的方法的過程是：

HashMap原理的深入理解

①判斷鍵值對數(shù)組table[i]是否為空或?yàn)閚ull，否則執(zhí)行resize()進(jìn)行擴(kuò)容；
②根據(jù)鍵值key計(jì)算hash值得到插入的數(shù)組索引i，如果table[i]==null，直接新建節(jié)點(diǎn)添加，轉(zhuǎn)向⑥，如果table[i]不為空，轉(zhuǎn)向③；
③判斷table[i]的首個元素是否和key一樣，如果相同直接覆蓋value，否則轉(zhuǎn)向④，這里的相同指的是hashCode以及equals；
④判斷table[i] 是否為treeNode，即table[i] 是否是紅黑樹，如果是紅黑樹，則直接在樹中插入鍵值對，否則轉(zhuǎn)向⑤；
⑤遍歷table[i]，判斷鏈表長度是否大于8，大于8的話把鏈表轉(zhuǎn)換為紅黑樹，在紅黑樹中執(zhí)行插入操作，否則進(jìn)行鏈表的插入操作；遍歷過程中若發(fā)現(xiàn)key已經(jīng)存在直接覆蓋value即可；
⑥插入成功后，判斷實(shí)際存在的鍵值對數(shù)量size是否超多了最大容量threshold，如果超過，進(jìn)行擴(kuò)容。

get值方法的過程是:

1、指定key 通過hash函數(shù)得到key的hash值
int hash=key.hashCode();

2、調(diào)用內(nèi)部方法 getNode()，得到桶號(一般都為hash值對桶數(shù)求模)
int index =hash%Entry[].length;

3、比較桶的內(nèi)部元素是否與key相等，若都不相等，則沒有找到。相等，則取出相等記錄的value。

4、如果得到 key 所在的桶的頭結(jié)點(diǎn)恰好是紅黑樹節(jié)點(diǎn)，就調(diào)用紅黑樹節(jié)點(diǎn)的 getTreeNode() 方法，否則就遍歷鏈表節(jié)點(diǎn)。getTreeNode 方法使通過調(diào)用樹形節(jié)點(diǎn)的 find()方法進(jìn)行查找。由于之前添加時已經(jīng)保證這個樹是有序的，因此查找時基本就是折半查找，效率很高。

5、如果對比節(jié)點(diǎn)的哈希值和要查找的哈希值相等，就會判斷 key 是否相等，相等就直接返回；不相等就從子樹中遞歸查找。

HashMap中直接地址用hash函數(shù)生成；解決沖突，用比較函數(shù)解決。如果每個桶內(nèi)部只有一個元素，那么查找的時候只有一次比較。當(dāng)許多桶內(nèi)沒有值時，許多查詢就會更快了(指查不到的時候)。

HashMap中的碰撞探測(collision detection)以及碰撞的解決方法

當(dāng)兩個對象的hashcode相同時，它們的bucket位置相同，‘碰撞'會發(fā)生。因?yàn)镠ashMap使用LinkedList存儲對象，這個Entry(包含有鍵值對的Map.Entry對象)會存儲在LinkedList中。這兩個對象就算hashcode相同，但是它們可能并不相等。那如何獲取這兩個對象的值呢？當(dāng)我們調(diào)用get()方法，HashMap會使用鍵對象的hashcode找到bucket位置，遍歷LinkedList直到找到值對象。找到bucket位置之后，會調(diào)用keys.equals()方法去找到LinkedList中正確的節(jié)點(diǎn)，最終找到要找的值對象使用不可變的、聲明作final的對象，并且采用合適的equals()和hashCode()方法的話，將會減少碰撞的發(fā)生，提高效率。不可變性使得能夠緩存不同鍵的hashcode，這將提高整個獲取對象的速度，使用String，Interger這樣的wrapper類作為鍵是非常好的選擇。

如何重新調(diào)整HashMap的大小

“如果HashMap的大小超過了負(fù)載因子(load factor)定義的容量，怎么辦？”

默認(rèn)的負(fù)載因子大小為0.75，也就是說，當(dāng)一個map填滿了75%的bucket時候，和其它集合類(如ArrayList等)一樣，將會創(chuàng)建原來HashMap大小的兩倍的bucket數(shù)組，來重新調(diào)整map的大小，并將原來的對象放入新的bucket數(shù)組中。這個過程叫作rehashing，因?yàn)樗{(diào)用hash方法找到新的bucket位置。

以上所述是小編給大家介紹的HashMap原理的理解詳解整合，希望對大家有所幫助，如果大家有任何疑問請給我留言，小編會及時回復(fù)大家的。在此也非常感謝大家對億速云網(wǎng)站的支持！

向AI問一下細(xì)節(jié)

HashMap原理的深入理解

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽