您好,登錄后才能下訂單哦!
本篇內(nèi)容介紹了“spark是如何使用堆棧的”的有關(guān)知識(shí),在實(shí)際案例的操作過程中,不少人都會(huì)遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
spark進(jìn)程是以JVM進(jìn)程運(yùn)行的,可以通過-Xmx和-Xms配置堆棧大小,它是如何使用堆棧呢?下面是spark內(nèi)存分配圖。
spark默認(rèn)JVM堆為512MB,為了避免OOM錯(cuò)誤,只使用90%。通過spark.storage.safetyFraction來設(shè)置。spark通過內(nèi)存來存儲(chǔ)需要處理的數(shù)據(jù),使用安全空間的60%,通過 spark.storage.memoryFraction來控制。如果我們想知道spark可以緩存多少數(shù)據(jù)?假設(shè)使用executors數(shù)為N,那么緩存數(shù)據(jù)為N*90%*60%*512MB。 ##shuffle memory shuffle memory的內(nèi)存為“Heap Size” * spark.shuffle.safetyFraction * spark.shuffle.memoryFraction。默認(rèn)spark.shuffle.safetyFraction 是 0.8 , spark.shuffle.memoryFraction是0.2 ,因此shuffle memory為 0.8*0.2*512MB = 0.16*512MB ##unroll memory unroll memory的內(nèi)存為spark.storage.unrollFraction * spark.storage.memoryFraction * spark.storage.safetyFraction,即0.2 * 0.6 * 0.9 * 512MB = 0.108 * 512MB。unroll memory用作數(shù)據(jù)序列化和反序列化。
“spark是如何使用堆棧的”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。