溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Java 中HashCode作用_動力節(jié)點Java學院整理

發(fā)布時間:2020-08-31 07:10:32 來源:腳本之家 閱讀:192 作者:mrr 欄目:編程語言

第1 部分 hashCode的作用

  Java集合中有兩類,一類是List,一類是Set他們之間的區(qū)別就在于List集合中的元素師有序的,且可以重復,而Set集合中元素是無序不可重復的。對于List好處理,但是對于Set而言我們要如何來保證元素不重復呢?通過迭代來equals()是否相等。數(shù)據(jù)量小還可以接受,當我們的數(shù)據(jù)量大的時候效率可想而知(當然我們可以利用算法進行優(yōu)化)。比如我們向HashSet插入1000數(shù)據(jù),難道我們真的要迭代1000次,調用1000次equals()方法嗎?hashCode提供了解決方案。怎么實現(xiàn)?我們先看hashCode的源碼(Object)。

public native int hashCode();

  它是一個本地方法,它的實現(xiàn)與本地機器有關,這里我們暫且認為他返回的是對象存儲的物理位置(實際上不是,這里寫是便于理解)。當我們向一個集合中添加某個元素,集合會首先調用hashCode方法,這樣就可以直接定位它所存儲的位置,若該處沒有其他元素,則直接保存。若該處已經(jīng)有元素存在,就調用equals方法來匹配這兩個元素是否相同,相同則不存,不同則散列到其他位置。這樣處理,當我們存入大量元素時就可以大大減少調用equals()方法的次數(shù),極大地提高了效率。

  所以hashCode在上面扮演的角色為尋域(尋找某個對象在集合中區(qū)域位置)。hashCode可以將集合分成若干個區(qū)域,每個對象都可以計算出他們的hash碼,可以將hash碼分組,每個分組對應著某個存儲區(qū)域,根據(jù)一個對象的hash碼就可以確定該對象所存儲區(qū)域,這樣就大大減少查詢匹配元素的數(shù)量,提高了查詢效率。 

  如何理解hashCode的作用:

  以java.lang.Object來理解,JVM每new一個Object,它都會將這個Object丟到一個Hash哈希表中去,這樣的話,下次做Object的比較或者取這個對象的時候,它會根據(jù)對象的hashcode再從Hash表中取這個對象。這樣做的目的是提高取對象的效率。具體過程是這樣:

1.new Object(),JVM根據(jù)這個對象的Hashcode值,放入到對應的Hash表對應的Key上,如果不同的對象確產(chǎn)生了相同的hash值,也就是發(fā)生了Hash key相同導致沖突的情況,那么就在這個Hash key的地方產(chǎn)生一個鏈表,將所有產(chǎn)生相同hashcode的對象放到這個單鏈表上去,串在一起。

2.比較兩個對象的時候,首先根據(jù)他們的hashcode去hash表中找他的對象,當兩個對象的hashcode相同,那么就是說他們這兩個對象放在Hash表中的同一個key上,那么他們一定在這個key上的鏈表上。那么此時就只能根據(jù)Object的equal方法來比較這個對象是否equal。當兩個對象的hashcode不同的話,肯定他們不能equal.

java.lang.Object中對hashCode的約定:

   1. 在一個應用程序執(zhí)行期間,如果一個對象的equals方法做比較所用到的信息沒有被修改的話,則對該對象調用hashCode方法多次,它必須始終如一地返回同一個整數(shù)。

   2. 如果兩個對象根據(jù)equals(Object o)方法是相等的,則調用這兩個對象中任一對象的hashCode方法必須產(chǎn)生相同的整數(shù)結果。
 

  3. 如果兩個對象根據(jù)equals(Object o)方法是不相等的,則調用這兩個對象中任一個對象的hashCode方法,不要求產(chǎn)生不同的整數(shù)結果。但如果能不同,則可能提高散列表的性能。

  有一個概念要牢記,兩個相等對象的equals方法一定為true, 但兩個hashcode相等的對象不一定是相等的對象。
所以hashcode相等只能保證兩個對象在一個HASH表里的同一條HASH鏈上,繼而通過equals方法才能確定是不是同一對象,如果結果為true, 則認為是同一對象在插入,否則認為是不同對象繼續(xù)插入。 

第2部分 hashCode對于一個對象的重要性

  一個對象的HashCode就是一個簡單的Hash算法的實現(xiàn),雖然它和那些真正的復雜的Hash算法相比還不能叫真正的算法,它如何實現(xiàn)它,不僅僅是程序員的編程水平問題, 而是關系到你的對象在存取是性能的非常重要的關系.有可能,不同的HashCode可能會使你的對象存取產(chǎn)生,成百上千倍的性能差別。先來看一下,在JAVA中兩個重要的數(shù)據(jù)結構:HashMap和Hashtable,雖然它們有很大的區(qū)別,如繼承關系不同,對value的約束條件(是否允許null)不同,以及線程安全性等有著特定的區(qū)別,但從實現(xiàn)原理上來說,它們是一致的。所以,只以Hashtable來說明:

  在java中,存取數(shù)據(jù)的性能,一般來說當然是首推數(shù)組,但是在數(shù)據(jù)量稍大的容器選擇中,Hashtable將有比數(shù)據(jù)性能更高的查詢速度。具體原因看下面的內容,Hashtable在存儲數(shù)據(jù)時,一般先將該對象的HashCode和0x7FFFFFFF做與操作,因為一個對象的HashCode可以為負數(shù),這樣操作后可以保證它為一個正整數(shù)。然后以Hashtable的長度取模,得到該對象在Hashtable中的索引。

int index = (hash & 0x7FFFFFFF) % tab.length;

這個對象就會直接放在Hashtable的每index位置,對于寫入,這和數(shù)據(jù)一樣,把一個對象放在其中的第index位置,但如果是查詢,經(jīng)過同樣的算法,Hashtable可以直接從第index取得這個對象,而數(shù)組卻要做循環(huán)比較.所以對于數(shù)據(jù)量稍大時,Hashtable的查詢比數(shù)據(jù)具有更高的性能。

既然一個對象可以根據(jù)HashCode直接定位它在Hashtable中的位置,那么為什么Hashtable還要用key來做映射呢?這就是關系Hashtable性能問題的最重要的問題:Hash沖突。

  常見的Hash沖突是不同對象最終產(chǎn)生了相同的索引,而一種非常甚至絕對少見的Hash沖突是,如果一組對象的個數(shù)大過了int 范圍,而HashCode的長度只能在int范圍中,所以肯定要有同一組的元素有相同的HashCode,這樣無論如何他們都會有相同的 索引。當然這種極端的情況是極少見的,可以暫不考慮,但是對于同的HashCode經(jīng)過取模,則會產(chǎn)生相同的索引,或者不同 的對象卻具有相同的HashCode,當然具有相同的索引。所以對于索引相同的對象,在該index位置存放了多個值,這些值要想能正確區(qū)分,就要依靠key來識別。事實上一個設計各好的HashTable,一般來說會比較平均地分布每個元素,因為Hashtable的長度總是比實際元素的個數(shù)按一 定比例進行自增(裝填因子一般為0.75)左右,這樣大多數(shù)的索引位置只有一個對象,而很少的位置會有幾個元素,所以 Hashtable中的每個位置存放的是一個鏈表,對于只有一個對象是位置,鏈表只有一個首節(jié)點(Entry),Entry的next為null。然后有hashCode,key,value屬性保存了該位置的對象的HashCode,key和value(對象本身),如果有相同索引的對象進來則 會進入鏈表的下一個節(jié)點。如果同一個索引中有多個對象,根據(jù)HashCode和key可以在該鏈表中找到一個和查詢的key相匹配的對象。

  從上面我看可以看到,對于HashMap和Hashtable的存取性能有重大影響的首先是應該使該數(shù)據(jù)結構中的元素盡量大可能具有不同的HashCode,雖然這并不能保證不同的HashCode產(chǎn)生不同的index,但相同的HashCode一定產(chǎn)生相同的index,從而影響 產(chǎn)生Hash沖突。

對于一個象,如果具有很多屬性,把所有屬性都參與散列,顯然是一種笨拙的設計。因為對象的HashCode()方法幾乎無所不在 地被自動調用,如equals比較,如果太多的對象參與了散列。那么需要的操作常數(shù)時間將會增加很大。所以,挑選哪些屬性參與散列絕對是一個編程水平的問題。

我們知道,每次調用HashCode方法方法,都要重新 對方法內的參與散列的對象重新計算一次它們的HashCode的運算,如果一個對象的屬性沒有改變,仍然要每次都進行計算, 所以如果設置一個標記來緩存當前的散列碼,只要當參與散列的對象改變時才重新計算,否則調用緩存的hashCode,這可以 從很大程度上提高性能。默認的實現(xiàn)是將對象內部地址轉化為整數(shù)作為HashCode,這當然能保證每個對象具有不同的HasCode,因為不同的對象內部地 址肯定不同,但java語言并不能讓程序員獲取對象內部地址,所以,讓每個對象產(chǎn)生不同的HashCode有著很多可研究 的技術。如果從多個屬性中采樣出能具有平均分布的hashCode的屬性,這是一個性能和多樣性相矛盾的地方,如果所有屬性都參與散 列,當然hashCode的多樣性將大大提高,但犧牲了性能,而如果只能少量的屬性采樣散列,極端情況會產(chǎn)生大量的散列沖突 ,如對"人"的屬性中,如果用性別而不是姓名或出生日期,那將只有兩個或幾個可選的hashcode值,將產(chǎn)生一半以上的散列 沖突.所以如果可能的條件下,專門產(chǎn)生一個序列用來生成HashCode將是一個好的選擇(當然產(chǎn)生序列的性能要比所有屬性參 與散列的性能高的情況下才行,否則還不如直接用所有屬性散列). 如何對HashCode的性能和多樣性求得一個平衡,可以參考相關算法設計的書,其實并不一定要求非常的優(yōu)秀,只要能盡最大 可能減少散列值的聚集。重要的是我們應該記得HashCode對于我們的程序性能有著重要的影響,在程序設計時應該時時加以注 意.

請記?。喝绻阆胗行У氖褂肏ashMap,你就必須重寫在其的HashCode()。

還有兩條重寫HashCode()的原則:

1.不必對每個不同的對象都產(chǎn)生一個唯一的hashcode,只要你的HashCode方法使get()能夠得到put()放進去的內容就可以了。即“不為一原則”。

2.生成hashcode的算法盡量使hashcode的值分散一些, 不要很多hashcode都集中在一個范圍內,這樣有利 于提高HashMap的性能。即“分散原則”。

至于第二條原則的具體原因,有興趣者可以參考Bruce Eckel的《Thinking in Java》,在那里有對HashMap內部實現(xiàn)原理的介紹,這里就不贅述了。 

第3部分 hashCode與equals

在Java中hashCode的實現(xiàn)總是伴隨著equals,他們是緊密配合的,你要是自己設計了其中一個,就要設計另外一個。當然在多數(shù)情況下,這兩個方法是不用我們考慮的,直接使用默認方法就可以幫助我們解決很多問題。但是在有些情況,我們必須要自己動手來實現(xiàn)它,才能確保程序更好的運作。

      對于equals,我們必須遵循如下規(guī)則:

      對稱性:如果x.equals(y)返回是“true”,那么y.equals(x)也應該返回是“true”。

      反射性:x.equals(x)必須返回是“true”。

      類推性:如果x.equals(y)返回是“true”,而且y.equals(z)返回是“true”,那么z.equals(x)也應該返回是“true”。

      一致性:如果x.equals(y)返回是“true”,只要x和y內容一直不變,不管你重復x.equals(y)多少次,返回都是“true”。

      任何情況下,x.equals(null),永遠返回是“false”;x.equals(和x不同類型的對象)永遠返回是“false”。

      對于hashCode,我們應該遵循如下規(guī)則:

      1. 在一個應用程序執(zhí)行期間,如果一個對象的equals方法做比較所用到的信息沒有被修改的話,則對該對象調用hashCode方法多次,它必須始終如一地返回同一個整數(shù)。   

   2. 如果兩個對象根據(jù)equals(Object o)方法是相等的,則調用這兩個對象中任一對象的hashCode方法必須產(chǎn)生相同的整數(shù)結果。

      3. 如果兩個對象根據(jù)equals(Object o)方法是不相等的,則調用這兩個對象中任一個對象的hashCode方法,不要求產(chǎn)生不同的整數(shù)結果。但如果能不同,則可能提高散列表的性能。

      至于兩者之間的關聯(lián)關系,我們只需要記住如下即可:

      如果x.equals(y)返回“true”,那么x和y的hashCode()必須相等。

      如果x.equals(y)返回“false”,那么x和y的hashCode()有可能相等,也有可能不等。

      理清了上面的關系我們就知道他們兩者是如何配合起來工作的。先看下圖: 

Java 中HashCode作用_動力節(jié)點Java學院整理

      整個處理流程是:

      1、判斷兩個對象的hashcode是否相等,若不等,則認為兩個對象不等,完畢,若相等,則比較equals。

      2、若兩個對象的equals不等,則可以認為兩個對象不等,否則認為他們相等。

實例: 

 package com.weakHashMap;
 /**
 * 重新實現(xiàn)了hashCode方法和equals方法
 * @ClassName: Person 
 * 
 * 
 */
 public class Person {
  private int age;
  private int sex; // 0:男,1:女
  private String name;
  private final int PRIME = 37;
  Person(int age ,int sex ,String name){
   this.age = age;
   this.sex = sex;
   this.name = name;
  }
  public int getAge() {
   return age;
  }
  public void setAge(int age) {
   this.age = age;
  }
  public int getSex() {
   return sex;
  }
  public void setSex(int sex) {
   this.sex = sex;
  }
  public String getName() {
   return name;
  }
  public void setName(String name) {
   this.name = name;
  }
  @Override
  public int hashCode() {
   System.out.println("調用hashCode方法...........");
   int hashResult = 1;
   hashResult = (hashResult + Integer.valueOf(age).hashCode() + Integer.valueOf(sex).hashCode()) * PRIME;
   hashResult = PRIME * hashResult + ((name == null) ? 0 : name.hashCode()); 
   System.out.println("name:"+name +" hashCode:" + hashResult);
   return hashResult;
  }
  /**
  * 重寫hashCode()
  */
  public boolean equals(Object obj) {
   System.out.println("調用equals方法...........");
   if(obj == null){
    return false;
   }
   if(obj.getClass() != this.getClass()){
    return false;
   }
   if(this == obj){
    return true;
   }
   Person person = (Person) obj;
   if(getAge() != person.getAge() || getSex()!= person.getSex()){
    return false;
   }
   if(getName() != null){
    if(!getName().equals(person.getName())){
     return false;
    }
   }
   else if(person != null){
    return false;
   }
   return true;
  }
 
 }
 
 package com.weakHashMap;
 import java.util.HashSet;
 import java.util.Set;
 /**
 * 
 * @ClassName: test1
 * TODO *
 * 
 */
 public class test extends Person{
  /**
  * @param age
  * @param sex
  * @param name
  */
  test(int age, int sex, String name) {
   super(age, sex, name);
   // TODO Auto-generated constructor stub
  }
  public static void main(String[] args){
   Set<Person> set = new HashSet<Person>();
   Person p1 = new Person(11, 1, "張三");
   Person p2 = new Person(12, 1, "李四");
  Person p3 = new Person(11, 1, "張三");
   Person p4 = new Person(11, 1, "李四");
   //只驗證p1、p3
   System.out.println("p1 == p3? :" + (p1 == p3));
  System.out.println("p1.equals(p3)?:"+p1.equals(p3));
   System.out.println("-----------------------分割線--------------------------");
  set.add(p1);
  set.add(p2);
  set.add(p3);
   set.add(p4);
  System.out.println("set.size()="+set.size());
 }
 }

結果:

p1 == p3? :false
調用equals方法...........
p1.equals(p3)?:true
-----------------------分割線--------------------------
調用hashCode方法...........
name:張三 hashCode:792686
調用hashCode方法...........
name:李四 hashCode:861227
調用hashCode方法...........
name:張三 hashCode:792686
調用equals方法...........
調用hashCode方法...........
name:李四 hashCode:859858
set.size()=3 

可以看到張三的兩次hashCode相同,調用equals進行匹配,最后hashCode 和 equals 都返回true,則不添加。

以上所述是小編給大家介紹的Java 中HashCode作用_動力節(jié)點Java學院整理,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對億速云網(wǎng)站的支持!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內容。

AI