溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Java并發(fā)中的內(nèi)存模型

發(fā)布時(shí)間:2021-09-13 11:44:08 來源:億速云 閱讀:92 作者:chen 欄目:編程語言

這篇文章主要講解了“Java并發(fā)中的內(nèi)存模型”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“Java并發(fā)中的內(nèi)存模型”吧!

CPU和內(nèi)存

在講JMM之前,我想先和大家聊聊硬件層面的東西。大家應(yīng)該都知道執(zhí)行運(yùn)算操作的CPU本身是不具備存儲(chǔ)能力的,它只負(fù)責(zé)根據(jù)指令對(duì)傳遞進(jìn)來的數(shù)據(jù)做相應(yīng)的運(yùn)算,而數(shù)據(jù)存儲(chǔ)這一任務(wù)則交給內(nèi)存去完成。雖然內(nèi)存的運(yùn)行速度雖然比起硬盤快非常多,但是和3GHZ,4GHZ,甚至5GHZ的CPU比起來還是太慢了,在CPU的眼中,內(nèi)存運(yùn)行的速度簡(jiǎn)直就是弟弟中的弟弟,等內(nèi)存進(jìn)行一次讀寫操作,CPU能思考成百上千次人生了:grin:。但是CPU的運(yùn)算能力是緊缺資源啊,可不能這么白白浪費(fèi)了,所以得想辦法解決這一個(gè)問題。

沒有什么問題是一個(gè)緩存不能解決的,如果有,那就再加一個(gè)緩存 ——魯迅:反正我沒說這句話

所以人們就想到了給CPU增加一個(gè)高速緩存(為什么是加高速緩存而不是給內(nèi)存提高速度就牽扯到硬件成本問題了)來解決這個(gè)問題,比如像博主用的Intel的I9 9900k CPU就帶了高達(dá)16M的三級(jí)緩存,所以硬件上的內(nèi)存模型大概如下圖所示。

Java并發(fā)中的內(nèi)存模型

如圖可以很清楚的看到,在CPU內(nèi)部構(gòu)建了一到多層的緩存,并且其中的L1 Cache是CPU內(nèi)核心獨(dú)有的,不同的Core之間是不能共享的,而L2 Cache則是所有的核心共享。簡(jiǎn)單來說就是CPU在讀取一個(gè)數(shù)據(jù)時(shí)會(huì)先去最近的Cache層級(jí)上讀取,如果找不到則會(huì)去下一個(gè)層級(jí)尋找,都找不到的話就會(huì)從內(nèi)存中去加載,而如果Cache中能拿到所需要的數(shù)據(jù)就不會(huì)去內(nèi)存讀取。在將數(shù)據(jù)寫回的時(shí)候也會(huì)先寫入Cache中,等待合適的時(shí)機(jī)再寫入到內(nèi)存中(其中有一個(gè)細(xì)節(jié)就是緩存行的問題,關(guān)于這部分內(nèi)容放在文章結(jié)尾)。而由于存在多個(gè)cache層級(jí),并且部分cache還不能夠被共享,所以會(huì)存在內(nèi)存可見性的問題。

舉個(gè)簡(jiǎn)單的例子: 假設(shè)現(xiàn)在存在兩個(gè)Core,分別是CoreA和CoreB并且他們都擁有屬于自己的L1Chace和共用的L2Cache。同時(shí)有一個(gè)變量X的值為1,該變量已經(jīng)被加載在L2Cahce上。此時(shí)CoreA執(zhí)行運(yùn)算需要用到變量X,先去L1Cache尋找,未命中,繼續(xù)在L2Cache尋找,命中成功,將X=1載入L1Cahce,再經(jīng)過一系列運(yùn)算后將X修改為2并寫入L1Cache。于此同時(shí)CoreB剛好也需要X來進(jìn)行運(yùn)算,此時(shí)他去自己的L1Cahce尋找,未命中,繼續(xù)L2Cache尋找,命中成功,將X=1載入自己的L1Cache。此時(shí)就出現(xiàn)了問題,CoreA明明已經(jīng)將X的值修改為2了,CoreB讀取到的依然是X=1,這就是內(nèi)存可見性問題。

看到這里的小伙伴們可能要問了,博主你啥情況啊,你這寫的漸漸忘記標(biāo)題了啊,說好了Java內(nèi)存模型,你扯這么多硬件上的問題干啥?。?╯‵□′)╯︵┻━┻

Java中的主內(nèi)存和工作內(nèi)存

小伙伴們別著急,其實(shí)JMM和上面的硬件層次上的模型很像,不信看下面的圖片

Java并發(fā)中的內(nèi)存模型

怎么樣,是不是看起來很像,可以簡(jiǎn)單的理解為線程的工作內(nèi)存就是CPU里Core獨(dú)占的L1Cahce,而主內(nèi)存就是共享的L2Cache。所以上述的內(nèi)存一致性問題也會(huì)在JMM中存在,而JMM就需要制定一些列的規(guī)則來保證內(nèi)存一致性,這也是Java多線程并發(fā)的一個(gè)疑難點(diǎn),那么JMM制定了哪些規(guī)則呢?

內(nèi)存間交互操作 首先是主內(nèi)存的工作內(nèi)存之間的交互協(xié)議,具體來說定義了以下幾個(gè)操作(并且保證這幾個(gè)操作都是原子性的):

  • lock (鎖定)作用于主內(nèi)存的變量,將一個(gè)變量標(biāo)識(shí)為一個(gè)線程獨(dú)占狀態(tài)

  • unlock(解鎖)作用于主內(nèi)存的變量,將一個(gè)處于鎖定狀態(tài)的變量釋放出來,釋放之后才能被其他線程鎖定

  • read(讀取)作用于主內(nèi)存的變量,將一個(gè)變量的值從主內(nèi)存?zhèn)鬏數(shù)骄€程工作內(nèi)存中,便于之后的load操作使用

  • load(載入)作用于工作內(nèi)存的變量,它把read操作從主內(nèi)存中得到的變量值放入工作內(nèi)存的變量副本中。

  • use(使用)作用于工作內(nèi)存的變量,把工作內(nèi)存中的一個(gè)變量值傳遞給執(zhí)行引擎,每當(dāng)虛擬機(jī)遇到一個(gè)需要使用變量的值的字節(jié)碼指令時(shí)將會(huì)執(zhí)行這個(gè)操作。

  • assign(賦值)作用于工作內(nèi)存的變量,它把一個(gè)從執(zhí)行引擎接收到的值賦值給工作內(nèi)存的變量,每當(dāng)虛擬機(jī)遇到一個(gè)給變量賦值的字節(jié)碼指令時(shí)執(zhí)行這個(gè)操作。

  • store(存儲(chǔ))作用于工作內(nèi)存的變量,把工作內(nèi)存中的一個(gè)變量的值傳送到主內(nèi)存中,以便隨后的write的操作。

  • write(寫入)作用于主內(nèi)存的變量,它把store操作從工作內(nèi)存中一個(gè)變量的值傳送到主內(nèi)存的變量中。

同時(shí)還規(guī)定了執(zhí)行上述八個(gè)操作時(shí)必須遵循以下規(guī)則:

  • 如果要把一個(gè)變量從主內(nèi)存中復(fù)制到工作內(nèi)存,就需要按順尋地執(zhí)行read和load操作, 如果把變量從工作內(nèi)存中同步回主內(nèi)存中,就要按順序地執(zhí)行store和write操作。但Java內(nèi)存模型只要求上述操作必須按順序執(zhí)行,而沒有保證必須是連續(xù)執(zhí)行。

  • 不允許read和load、store和write操作之一單獨(dú)出現(xiàn)

  • 不允許一個(gè)線程丟棄它的最近assign的操作,即變量在工作內(nèi)存中改變了之后必須同步到主內(nèi)存中。

  • 不允許一個(gè)線程無原因地(沒有發(fā)生過任何assign操作)把數(shù)據(jù)從工作內(nèi)存同步回主內(nèi)存中。

  • 一個(gè)新的變量只能在主內(nèi)存中誕生,不允許在工作內(nèi)存中直接使用一個(gè)未被初始化(load或assign)的變量。即就是對(duì)一個(gè)變量實(shí)施use和store操作之前,必須先執(zhí)行過了assign和load操作。

  • 一個(gè)變量在同一時(shí)刻只允許一條線程對(duì)其進(jìn)行l(wèi)ock操作,但lock操作可以被同一條線程重復(fù)執(zhí)行多次,多次執(zhí)行l(wèi)ock后,只有執(zhí)行相同次數(shù)的unlock操作,變量才會(huì)被解鎖。lock和unlock必須成對(duì)出現(xiàn)

  • 如果對(duì)一個(gè)變量執(zhí)行l(wèi)ock操作,將會(huì)清空工作內(nèi)存中此變量的值,在執(zhí)行引擎使用這個(gè)變量前需要重新執(zhí)行l(wèi)oad或assign操作初始化變量的值

  • 如果一個(gè)變量事先沒有被lock操作鎖定,則不允許對(duì)它執(zhí)行unlock操作;也不允許去unlock一個(gè)被其他線程鎖定的變量。

  • 對(duì)一個(gè)變量執(zhí)行unlock操作之前,必須先把此變量同步到主內(nèi)存中(執(zhí)行store和write操作)。

(上述部分參考并引用《深入理解Java虛擬機(jī)》中的內(nèi)容)

volatile(能夠保證內(nèi)存可見性和禁止指令重排序)

對(duì)于volatile修飾的變量,JMM對(duì)其有一些特殊的規(guī)定。

內(nèi)存可見性

往簡(jiǎn)單來說volatile關(guān)鍵字可以理解為,有一個(gè)volatile修飾的變量x,當(dāng)一個(gè)線程需要使用該變量的時(shí)候,直接從主內(nèi)存中讀取,而當(dāng)一個(gè)線程修改該變量的值時(shí),直接寫入到主內(nèi)存中。根據(jù)之前的分析我們能得出具備這些特性的volatile能夠保證一個(gè)變量的內(nèi)存可見性和內(nèi)存一致性。

指令重排序

指令重排序是一個(gè)大部分CPU都有的操作,同時(shí)JVM在運(yùn)行時(shí)也會(huì)存在指令重排序的操作。 簡(jiǎn)單舉個(gè):chestnut:

      private void test(){        int a,b,c;//1
        a=1;//2
        b=3;//3
        c=a+b;//4
    }

假設(shè)有上面這么一個(gè)方法,內(nèi)部有這4行代碼。那么JVM可能會(huì)對(duì)其進(jìn)行指令重排序,而指令重排序的規(guī)定則是as-if-serial 不管怎么重排序(編譯器和處理器為了提高并行度),(單線程)程序的執(zhí)行結(jié)果不能被改變。根據(jù)這一規(guī)定,編譯器和處理器不會(huì)對(duì)有依賴關(guān)系的指令重排序,但是對(duì)沒有依賴的指令則可能會(huì)進(jìn)行重排序。放在上面的例子里面就是,第1行代碼和2,3,4行代碼是有依賴關(guān)系的,所以第一行代碼的指令必須排在2,3,4之前,因?yàn)椴豢赡軐?duì)一個(gè)未定義的變量進(jìn)行賦值操作。而第2,3行代碼之間并沒有相互依賴關(guān)系,所以此處可能會(huì)發(fā)生指令重排序,先執(zhí)行3,再執(zhí)行2。而最后的第4行代碼和之前的3行代碼都有依賴關(guān)系,所以他一定會(huì)放在最后執(zhí)行。

既然JVM特別指出指令重排序只在單線程下和未排序的效果一致,那是否表示在多線程下會(huì)存在一些問題呢? 答案是肯定的,多線程下指令重排序會(huì)帶來一些意想不到的結(jié)果。

 int a=0;    //flag作為一個(gè)標(biāo)識(shí)符,標(biāo)識(shí)是否寫入完成
    boolean flag = false;    public void writer(){
        a=10;//1
        flag=true;//2
    }    public void reader(){        if (flag)
            System.out.println("a:"+a);
    }

假設(shè)存在一個(gè)類,他有上述部分的field和method,該類在設(shè)計(jì)上以flag作為寫入是否完成的標(biāo)志,在單線程下這并不會(huì)存在問題。而此時(shí)有兩個(gè)線程分別執(zhí)行writer和reader方法,暫時(shí)不考慮內(nèi)存可見性的問題,假設(shè)對(duì)a和flag的寫入,是立即被其他線程所知曉的,這個(gè)時(shí)候大家覺得輸出a的值為多少?10?

即使不考慮內(nèi)存可見性,此時(shí)a的值還是有可能會(huì)輸出0,這就是指令重排序帶來的問題。在上述代碼中注釋1和2處的代碼是沒有依賴關(guān)系的,在單線程下先執(zhí)行1還是2都沒有任何問題,根據(jù)as-if-serial 原則此時(shí)就可能會(huì)發(fā)生指令重排序。

而volatile關(guān)鍵字可以禁止指令重排序。

long,double的問題

我們都知道JMM定義的8個(gè)主內(nèi)存和工作內(nèi)存之間的操作都是具備原子性的,但是對(duì)long和double這兩個(gè)64位的數(shù)據(jù)類型有一些例外。

允許虛擬機(jī)將沒有被volatile修飾的long和double的64數(shù)據(jù)的讀寫操作劃分為兩次32位的讀寫操作,即不要求虛擬機(jī)保證對(duì)他們的load ,store,read,write四個(gè)操作的原子性。 但是大部分的虛擬機(jī)實(shí)現(xiàn)都保證了這四個(gè)操作的原子性的,所以大部分時(shí)候我們都不需要刻意的對(duì)long,double對(duì)象使用volatile修飾。

性能問題

volatile是Java提供的保證內(nèi)存可見性的最輕量級(jí)操作,比起重量級(jí)的synchronized能快上不少,但是具體能快多少這部分沒辦法量化。而我們可以知道的是volatile修飾的變量讀操作的性能消耗幾乎和普通變量相差無幾,而寫操作則會(huì)慢上一些。所以當(dāng)volatile能解決我們的問題的時(shí)候(內(nèi)存可見性和禁止指令重排序),我們應(yīng)該優(yōu)先選擇使用volatile而不是鎖。

synchronized的內(nèi)存語義

簡(jiǎn)單概括就是

當(dāng)程序進(jìn)入synchronized塊時(shí),把在synchronized塊中用到的變量從工作內(nèi)存中清楚,這樣在需要訪問這些變量的時(shí)候會(huì)重新從主內(nèi)存中獲取。當(dāng)程序退出synchronized塊時(shí),把對(duì)塊中恭喜變量的修改刷新到主內(nèi)存。 如此依賴synchronized也能保證了內(nèi)存的可見性。

final的內(nèi)存語義

final也能保證內(nèi)存的可見性

被final修飾的字段在構(gòu)造器中一旦初始化完成,并且構(gòu)造器沒有把this引用傳遞出去,那么其他線程中就能看見final字段的值。

后記之CPU緩存行和偽共享

什么是偽共享

根據(jù)前面的文章,我們知道CPU和Memory之間是有Cache的,而Cache內(nèi)部是按行存儲(chǔ)的,行擁有固定的大小,這些行被稱為緩存行。 當(dāng)CPU訪問的某個(gè)變量不在Cache中時(shí),就會(huì)去內(nèi)存里獲取,并將該變量所在內(nèi)存的一個(gè)緩存行大小的數(shù)據(jù)讀入Cache中。由于一次讀取并不是單個(gè)對(duì)象而是一整個(gè)緩存行,所以可能會(huì)存在多個(gè)變量被讀入一個(gè)緩存行中。而一個(gè)緩存行只能同時(shí)被一個(gè)線程操作,所以當(dāng)多個(gè)線程同時(shí)修改一個(gè)緩存行里的多個(gè)變量時(shí)會(huì)造成其他線程等待從而帶來性能損耗(但是在單線程情況下,偽共享反而會(huì)提升性能,因?yàn)橐淮涡钥赡軙?huì)緩存多個(gè)變量,節(jié)省后續(xù)變量的讀取時(shí)間)。

如何避免偽共享

在Java8之后可以使用JDK提供的@sun.misc.Contended注解來解決偽共享,像Thread中的threadLocalRandom 字段就使用了這個(gè)注解。

感謝各位的閱讀,以上就是“Java并發(fā)中的內(nèi)存模型”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對(duì)Java并發(fā)中的內(nèi)存模型這一問題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是億速云,小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI