溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Hashmap的容量是2的冪次的原因

發(fā)布時(shí)間:2020-10-30 19:12:33 來(lái)源:億速云 閱讀:198 作者:Leah 欄目:開(kāi)發(fā)技術(shù)

這篇文章將為大家詳細(xì)講解有關(guān)Hashmap的容量是2的冪次的原因,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個(gè)參考,希望大家閱讀完這篇文章后對(duì)相關(guān)知識(shí)有一定的了解。

做為面試常考的問(wèn)題之一,每次都答的模模糊糊,有必要了解一下,首先來(lái)看一下hashmap的put方法的源碼

public V put(K key, V value) {
  if (key == null)    
   return putForNullKey(value);  //將空key的Entry加入到table[0]中
  int hash = hash(key.hashCode());  //計(jì)算key.hashcode()的hash值,hash函數(shù)由hashmap自己實(shí)現(xiàn)
  int i = indexFor(hash, table.length);//獲取將要存放的數(shù)組下標(biāo)
  /*
   * for中的代碼用于:當(dāng)hash值相同且key相同的情況下,使用新值覆蓋舊值(其實(shí)就是修改功能)
   */
  for (Entry<K, V> e = table[i]; e != null; e = e.next) {//注意:for循環(huán)在第一次執(zhí)行時(shí)就會(huì)先判斷條件
   Object k;
   //hash值相同且key相同的情況下,使用新值覆蓋舊值
   if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
    V oldValue = e.value;
    e.value = value;
    //e.recordAccess(this);
    return oldValue;//返回舊值
   }
  }
  
  modCount++;
  addEntry(hash, key, value, i);//增加一個(gè)新的Entry到table[i]
  return null;//如果沒(méi)有與傳入的key相等的Entry,就返回null
 }

/**
  * "按位與"來(lái)獲取數(shù)組下標(biāo)
  */
 static int indexFor(int h, int length) {
  return h & (length - 1);
 }

hashmap始終將自己的桶保持在2的n次方,這是為什么?indexFor這個(gè)方法解釋了這個(gè)問(wèn)題

大家都知道計(jì)算機(jī)里面位運(yùn)算是基本運(yùn)算,位運(yùn)算的效率是遠(yuǎn)遠(yuǎn)高于取余%運(yùn)算的

舉個(gè)例子:

2^n轉(zhuǎn)換成二進(jìn)制就是1+n個(gè)0,減1之后就是0+n個(gè)1,如16 -> 10000,15 -> 01111

那么根據(jù)&位運(yùn)算的規(guī)則,都為1(真)時(shí),才為1,那0≤運(yùn)算后的結(jié)果≤15,假設(shè)h <= 15,那么運(yùn)算后的結(jié)果就是h本身,h >15,運(yùn)算后的結(jié)果就是最后四位二進(jìn)制做&運(yùn)算后的值,最終,就是%運(yùn)算后的余數(shù)。

當(dāng)容量一定是2^n時(shí),h & (length - 1) == h % length

補(bǔ)充知識(shí):HashMap容量和負(fù)載因子

HashMap底層數(shù)據(jù)結(jié)構(gòu)是數(shù)組+鏈表,JDK1.8中還引入了紅黑樹(shù),當(dāng)鏈表長(zhǎng)度超過(guò)8個(gè)時(shí),會(huì)將鏈表轉(zhuǎn)成紅黑樹(shù),以提升其查找性能。那么,給出一個(gè)<key, value>節(jié)點(diǎn),HashMap是如何確定這個(gè)節(jié)點(diǎn)應(yīng)該放在具體哪個(gè)位置呢?(以JDK1.8為例)

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
  Node<K,V>[] tab; Node<K,V> p; int n, i;
  // HashMap沒(méi)有被初始化,則先進(jìn)行初始化
  if ((tab = table) == null || (n = tab.length) == 0)
    n = (tab = resize()).length;
  // 節(jié)點(diǎn)所在index = (n - 1) & hash,該位置沒(méi)有數(shù)據(jù),則直接將新節(jié)點(diǎn)放在數(shù)組的index位置上
  if ((p = tab[i = (n - 1) & hash]) == null)
    tab[i] = newNode(hash, key, value, null);
  else { // index上已經(jīng)有節(jié)點(diǎn)了
    Node<K,V> e; K k;
    // 如果新key與原來(lái)的key一樣,則e指向原節(jié)點(diǎn)p(后面會(huì)用新value替換e所指向的value)
    if (p.hash == hash &&
      ((k = p.key) == key || (key != null && key.equals(k)))) 
      e = p;
    // 如果該節(jié)點(diǎn)是樹(shù)節(jié)點(diǎn),則采用樹(shù)的插入算法,插入新節(jié)點(diǎn)
    else if (p instanceof HashMap.TreeNode)
      e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
    else { // 該節(jié)點(diǎn)是鏈表節(jié)點(diǎn)
      for (int binCount = 0; ; ++binCount) {
        // 將新節(jié)點(diǎn)插入到index所在鏈表的末端
        if ((e = p.next) == null) {
          p.next = newNode(hash, key, value, null);
          // 鏈表節(jié)點(diǎn)超過(guò)8個(gè),則進(jìn)行鏈表轉(zhuǎn)樹(shù)處理
          if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
            treeifyBin(tab, hash);
          break;
        }
        // 同樣的,如果key已經(jīng)存在的話,則不進(jìn)行插入操作,而是后面進(jìn)行value替換
        if (e.hash == hash &&
          ((k = e.key) == key || (key != null && key.equals(k))))
          break;
        p = e;
      }
    }
    // e != null的情況,就是key已經(jīng)存在了,這里統(tǒng)一進(jìn)行了新值value,替換舊值e.value的操作
    if (e != null) { // existing mapping for key
      V oldValue = e.value;
      if (!onlyIfAbsent || oldValue == null)
        e.value = value;
      afterNodeAccess(e);
      return oldValue;
    }
  }
  ++modCount;
  // 插入后數(shù)組size 大于閾值的話,需要進(jìn)行擴(kuò)容
  if (++size > threshold)
    resize();
  afterNodeInsertion(evict);
  return null;
}

看源碼,節(jié)點(diǎn)落在數(shù)組中的index = (數(shù)組長(zhǎng)度 - 1) & key的hashcode,如果該index上沒(méi)有數(shù)據(jù),則直接插到該index上,如果節(jié)點(diǎn)已經(jīng)有數(shù)據(jù)了,則把新節(jié)點(diǎn)插入該index對(duì)應(yīng)的鏈表中(如果鏈表節(jié)點(diǎn)大于8個(gè),會(huì)進(jìn)行鏈表轉(zhuǎn)樹(shù),之后的插入算法就變成了樹(shù)的插入算法)。

每次put之后,會(huì)檢測(cè)一下是否需要擴(kuò)容,size超過(guò)了 總?cè)萘?* 負(fù)載因子,則會(huì)擴(kuò)容。默認(rèn)情況下,16 * 0.75 = 12個(gè)。

Hashmap的容量是2的冪次的原因

1、為什么初始容量是16

當(dāng)容量為2的冪時(shí),上述n -1 對(duì)應(yīng)的二進(jìn)制數(shù)全為1,這樣才能保證它和key的hashcode做&運(yùn)算后,能夠均勻分布,這樣才能減少hash碰撞的次數(shù)。至于默認(rèn)值為什么是16,而不是2 、4、8,或者32、64、1024等,我想應(yīng)該就是個(gè)折中處理,過(guò)小會(huì)導(dǎo)致放不下幾個(gè)元素,就要進(jìn)行擴(kuò)容了,而擴(kuò)容是一個(gè)很消耗性能的操作。取值過(guò)大的話,無(wú)疑會(huì)浪費(fèi)更多的內(nèi)存空間。因此在日常開(kāi)發(fā)中,如果可以預(yù)估HashMap會(huì)存入節(jié)點(diǎn)的數(shù)量,則應(yīng)該在初始化時(shí),指定其容量。

2、為什么負(fù)載因子是0.75

也是一個(gè)綜合考慮,如果設(shè)置過(guò)小,HashMap每put少量的數(shù)據(jù),都要進(jìn)行一次擴(kuò)容,而擴(kuò)容操作會(huì)消耗大量的性能。如果設(shè)置過(guò)大的話,如果設(shè)成1,容量還是16,假設(shè)現(xiàn)在數(shù)組上已經(jīng)占用的15個(gè),再要put數(shù)據(jù)進(jìn)來(lái),計(jì)算數(shù)組index時(shí),發(fā)生hash碰撞的概率將達(dá)到15/16,這違背的HashMap減少hash碰撞的原則。

關(guān)于Hashmap的容量是2的冪次的原因就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI