多核編程中的線程隨機競爭模式的概率分析

發(fā)布時間：2021-11-17 16:16:50 來源：億速云閱讀：122 作者：iii 欄目：web開發(fā)

這篇文章主要講解了“多核編程中的線程隨機競爭模式的概率分析”，文中的講解內(nèi)容簡單清晰，易于學(xué)習(xí)與理解，下面請大家跟著小編的思路慢慢深入，一起來研究和學(xué)習(xí)“多核編程中的線程隨機競爭模式的概率分析”吧！

并不是任意的共享數(shù)據(jù)都能夠設(shè)計成進行分組競爭的模式，比如最常用的需要用于查找的數(shù)據(jù)結(jié)構(gòu)，當(dāng)數(shù)據(jù)結(jié)構(gòu)分成多個子數(shù)據(jù)結(jié)構(gòu)后，每次查找時，不能指定查找某個特定的子數(shù)據(jù)結(jié)構(gòu)，而必須進行二級查找，先在整個數(shù)據(jù)結(jié)構(gòu)內(nèi)找到對應(yīng)的子數(shù)據(jù)結(jié)構(gòu)（不加鎖），然后再在子數(shù)據(jù)結(jié)構(gòu)中查找（加鎖）。如果同時多個線程進行查找，有可能查找的數(shù)據(jù)分布在不同的子數(shù)據(jù)結(jié)構(gòu)里，也可能分布在同一子數(shù)據(jù)結(jié)構(gòu)中。當(dāng)查找分布在同一子數(shù)據(jù)結(jié)構(gòu)時，這時就有可能發(fā)生鎖競爭現(xiàn)象，從而引起 CPU饑餓的發(fā)生。

在這種分布式數(shù)據(jù)結(jié)構(gòu)的隨機鎖競爭中，需要知道的是在一個k個核的CPU上，需要的線程數(shù)m和劃分的子數(shù)據(jù)結(jié)構(gòu)個數(shù)n為多少時，才能保證至少有k個線程在同時運行的概率不低于給定的概率P。

首先m必須大于等于k，否則無法保證至少有k個任務(wù)在運行。子數(shù)據(jù)結(jié)構(gòu)個數(shù)N也必須大于K，否則出現(xiàn)競爭的任務(wù)組數(shù)將少于k個，從而無法保證至少有k個任務(wù) 在運行，當(dāng)然n越大，任務(wù)出現(xiàn)競爭的概率就越小，同時運行的線程數(shù)量就越多，不妨設(shè)n大于等于m。在實際情況中，n并不是越大越好，當(dāng) n過大時，由于鎖的數(shù)量和n相等，會導(dǎo)致鎖占用過多的系統(tǒng)資源。

下面就來計算一下至少有k個線程在同時運行的概率，考慮一種最壞情況的假設(shè)：假設(shè)有兩個線程在訪問同一個子數(shù)據(jù)結(jié)構(gòu) ，那么它們一定會發(fā)生鎖競爭。在這種最壞假設(shè)下，要保證至少有k個線程在同時運行，實際上相當(dāng)于m個線程至少訪問了k個不同的子數(shù)據(jù)結(jié)構(gòu)。

假設(shè)訪問每個子數(shù)據(jù)結(jié)構(gòu)的線程數(shù)為Xi （ 0 <= Xi <= m, i∈{1,2,…n}）,這樣可以得到以下整數(shù)方程：

X1+X2+…+Xn = m （方程1）

要保證至少有k組線程在競爭，實際上相當(dāng)于X1,X2…Xn中必須至少有k個大于0，這樣至少有k個線程在運行的概率相當(dāng)于上述方程滿足,X2…Xn中必須至少有k個大于0的解的個數(shù)和所有可能解的個數(shù)的比值。

多核編程中的線程隨機競爭模式的概率分析

下面是對這個概率公式的一些實際計算結(jié)果：

當(dāng)k=2（2核CPU）, m=2（2個線程）， P=(n-1) / (n+1) 當(dāng)n=4時，P=0.6; 當(dāng)n＝8時，P=7/9 =0.7778; 當(dāng)n＝16時, P=15/17=0.882

當(dāng)k=2（2核CPU）, m=4（4個線程）， P=(n-1) (n＋3)/ ((n+1)(n+2)) + 9 (n-1)/((n+3)(n+2)(n+1)) 當(dāng)n=4時，P=0.83; 當(dāng)n＝8時，P=0.919; 當(dāng)n＝16時, P=0.954

當(dāng)k=4（4核CPU）, m=4（4個線程）， P=(n-1) (n-2)(n-3)/ ((n+1)(n+2)(n+3)) 當(dāng)n=4時，P=0.0286; 當(dāng)n＝8時，P=0.212; 當(dāng)n＝16時, P=0.47; 當(dāng)n＝32時，P=0.687

當(dāng)k=4（4核CPU）, m=6（6個線程）， P = [ 1+12(n+15)/((n+4)(n+5)) ] ×[(n-1)(n-2)(n-3)]/ [(n+1)(n+2)(n+3)] 當(dāng)n＝8時，P=0.587; 當(dāng)n＝16時, P=0.886; 當(dāng)n＝32時，P=0.978

從上面計算可以看出，當(dāng)CPU核數(shù)固定時，線程數(shù)m越多，則概率愈大，子數(shù)據(jù)結(jié)構(gòu)個數(shù)n越大，概率愈大。一般來說線程數(shù)***比核數(shù)大一倍，這樣得出的概率會大一些。

以上計算的是在最壞情況下的概率，實際情況中，由于兩個線程在競爭同一個子數(shù)據(jù)結(jié)構(gòu)時并不一定會發(fā)生競爭現(xiàn)象，因為可能發(fā)生線程A在進行鎖操作時，線程B正在執(zhí)行不需要加鎖部分的代碼，因此實際的概率會大于上面計算出的最壞情況下的概率。

分布式數(shù)據(jù)結(jié)構(gòu)隨機鎖競爭和無鎖編程的性能比較

在使用了隨機鎖競爭的分布式數(shù)據(jù)結(jié)構(gòu)中，并行化的加速比期望值等于前面所計算出的概率×CPU核數(shù)，因此只要將概率保持大于一定的值，那么加速比是可以得到保證的，并且只要加大線程個數(shù)和子數(shù)據(jù)結(jié)構(gòu)個數(shù)，那么加速比的期望值就會增加。另外分布式數(shù)據(jù)結(jié)構(gòu)中相比于單線程的數(shù)據(jù)結(jié)構(gòu)其操作要復(fù)雜一些，增加了一些計算開銷，另外加上鎖的計算開銷，因此加速比要打一個較大的折扣。但是分布式數(shù)據(jù)結(jié)構(gòu)的好處在于它的加速比系數(shù)不會隨CPU核數(shù)的增加而降低，程序的性能是隨著核數(shù)的增加而線形增加的（前提是在數(shù)據(jù) 結(jié)構(gòu)中的元素個數(shù)足夠多的情況下）。

在無鎖編程中，由于使用了原子操作，原子操作是串行化的，雖然原子操作占的比重很小，但是這種串行化反映到加速比計算上需要按照阿姆爾達定律來計算，因此其性能同樣不容樂觀，會隨著CPU核數(shù)的增加而降低。以一個無鎖的FIFO隊列為例，在進隊操作時需要使用一條CAS原子操作，由于隊列操作本身就很簡單，因此昂貴的CAS操作所占的比例也不容小覷，在這種隊列操作中，CAS所占的比例估計要達到20％左右（具體的數(shù)據(jù)需要通過測試才能確定），按照阿姆爾達定律，在一個8核的 CPU上的加速比系數(shù)將為3.33, 在一個64核CPU上，其加速比將小于5，當(dāng)然這是只考慮隊列操作沒有考慮程序中其他并行操作的極端情況，但是不管怎么說，采用無鎖編程的話，加速比系數(shù) 會隨CPU核數(shù)的增加而降低。

另外無鎖編程相比于單線程編程，其代碼也變復(fù)雜了，也增加了額外的計算開銷，加速比也需要另外打一個折扣。

如果將分布式數(shù)據(jù)結(jié)構(gòu)和單核時的多線程編程相比，則分布式數(shù)據(jù)結(jié)構(gòu)中，僅僅增加了定位到子數(shù)據(jù)結(jié)構(gòu)的開銷，如果是查找類型的數(shù)據(jù)結(jié)構(gòu)，子表的查找時間縮小了，實際上增加的開銷小于定位子數(shù)據(jù)結(jié)構(gòu)的開銷。因此分布式數(shù)據(jù)結(jié)構(gòu)增加的開銷所占的比例是非常小的，其性能近似（略低）于單核時的多線程編程。

在 CPU核數(shù)較少時，無鎖編程的性能可能會優(yōu)于分布式數(shù)據(jù)結(jié)構(gòu)，并且優(yōu)于單核多線程編程的性能，但是當(dāng)CPU核數(shù)增加到一定程度時，分布式數(shù)據(jù)結(jié)構(gòu)的性能優(yōu) 勢就體現(xiàn)出來了。采用分布式數(shù)據(jù)結(jié)構(gòu)可以復(fù)用部分單線程時的數(shù)據(jù)結(jié)構(gòu)代碼，采用加鎖機制容易被程序員理解，并且實現(xiàn)的功能不受限制。而無鎖編程則難度非常高，遠非普通程序員所能掌握，并且實現(xiàn)的功能受到限制，比如實現(xiàn)一個無鎖的隊列，如果想要給隊列加一個計數(shù)來掌握隊列中有多少元素，采用無鎖編程實現(xiàn)估計就很難行得通了，而這在有鎖編程中只是一個簡單得不能再簡單的東西。因此對程序員來說，分布式數(shù)據(jù)結(jié)構(gòu)是多核時代必需掌握的技術(shù)，而無鎖編程也許可以用在某些無法使用分布式數(shù)據(jù)結(jié)構(gòu)的特定場合。

需要說明的是前面對概率的計算隱含了一個前提，就是每個線程在訪問各個子數(shù)據(jù)結(jié)構(gòu)時的概率是相同的，這要求各個子數(shù)據(jù)結(jié)構(gòu)必須是負載均衡的，否則如果訪問各個子數(shù)據(jù)結(jié)構(gòu)的概率不相同的話，計算出的結(jié)果會小于前面的計算結(jié)果，考慮一種最極端的情況，所有的數(shù)據(jù)都在一個子數(shù)據(jù)結(jié)構(gòu)里，那么所有的線程都將競爭同一個子數(shù)據(jù)結(jié)構(gòu)，那么問題倒退回多核編程中的鎖競爭難題一文中描述一樣的情況，這是一種可能比阿姆爾達定律更糟糕的情況。100％的負載均衡是做不到的，所幸可以通過一定的手段來使數(shù)據(jù)盡量變得均衡，使得數(shù)據(jù)能夠相對較均勻地分布在各個子數(shù)據(jù)結(jié)構(gòu)中，這樣就不會對最終的概率產(chǎn)生較大影響。

感謝各位的閱讀，以上就是“多核編程中的線程隨機競爭模式的概率分析”的內(nèi)容了，經(jīng)過本文的學(xué)習(xí)后，相信大家對多核編程中的線程隨機競爭模式的概率分析這一問題有了更深刻的體會，具體使用情況還需要大家實踐驗證。這里是億速云，小編將為大家推送更多相關(guān)知識點的文章，歡迎關(guān)注！

向AI問一下細節(jié)

多核編程中的線程隨機競爭模式的概率分析

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標簽