<sup id="t59ml"><progress id="t59ml"></progress></sup>

<center id="t59ml"><strike id="t59ml"><source id="t59ml"></source></strike></center>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

如何解析Apache Spark 統(tǒng)一內(nèi)存管理模型

發(fā)布時間：2021-12-17 13:41:21 來源：億速云閱讀：96 作者：柒染欄目：大數(shù)據(jù)

今天就跟大家聊聊有關(guān)如何解析Apache Spark 統(tǒng)一內(nèi)存管理模型，可能很多人都不太了解，為了讓大家更加了解，小編給大家總結(jié)了以下內(nèi)容，希望大家根據(jù)這篇文章可以有所收獲。

Apache Spark 統(tǒng)一內(nèi)存管理模型詳解

下面將對 Spark 的內(nèi)存管理模型進行分析，下面的分析全部是基于 Apache Spark 2.2.1 進行的。為了讓下面的文章看起來不枯燥，我不打算貼出代碼層面的東西。文章僅對統(tǒng)一內(nèi)存管理模塊(UnifiedMemoryManager)進行分析，如對之前的靜態(tài)內(nèi)存管理感興趣，請參閱網(wǎng)上其他文章。

我們都知道 Spark 能夠有效的利用內(nèi)存并進行分布式計算，其內(nèi)存管理模塊在整個系統(tǒng)中扮演著非常重要的角色。為了更好地利用 Spark，深入地理解其內(nèi)存管理模型具有非常重要的意義，這有助于我們對 Spark 進行更好的調(diào)優(yōu)；在出現(xiàn)各種內(nèi)存問題時，能夠摸清頭腦，找到哪塊內(nèi)存區(qū)域出現(xiàn)問題。下文介紹的內(nèi)存模型全部指 Executor 端的內(nèi)存模型， Driver 端的內(nèi)存模型本文不做介紹。統(tǒng)一內(nèi)存管理模塊包括了堆內(nèi)內(nèi)存(On-heap Memory)和堆外內(nèi)存(Off-heap Memory)兩大區(qū)域，下面對這兩塊區(qū)域進行詳細的說明

堆內(nèi)內(nèi)存(On-heap Memory)

默認情況下，Spark 僅僅使用了堆內(nèi)內(nèi)存。Executor 端的堆內(nèi)內(nèi)存區(qū)域大致可以分為以下四大塊：

·Execution 內(nèi)存：主要用于存放 Shuffle、Join、Sort、Aggregation 等計算過程中的臨時數(shù)據(jù)

·Storage 內(nèi)存：主要用于存儲 spark 的 cache 數(shù)據(jù)，例如RDD的緩存、unroll數(shù)據(jù)；

·用戶內(nèi)存（User Memory）：主要用于存儲 RDD 轉(zhuǎn)換操作所需要的數(shù)據(jù)，例如 RDD 依賴等信息。

·預留內(nèi)存（Reserved Memory）：系統(tǒng)預留內(nèi)存，會用來存儲Spark內(nèi)部對象。

整個 Executor 端堆內(nèi)內(nèi)存如果用圖來表示的話，可以概括如下：

如何解析Apache Spark 統(tǒng)一內(nèi)存管理模型

如果想及時了解Spark、Hadoop或者Hbase相關(guān)的文章，歡迎關(guān)注微信公共帳號：iteblog_hadoop

我們對上圖進行以下說明：

·systemMemory = Runtime.getRuntime.maxMemory，其實就是通過參數(shù) spark.executor.memory 或 --executor-memory 配置的。

·reservedMemory 在 Spark 2.2.1 中是寫死的，其值等于 300MB，這個值是不能修改的（如果在測試環(huán)境下，我們可以通過 spark.testing.reservedMemory 參數(shù)進行修改）；

·usableMemory = systemMemory - reservedMemory，這個就是 Spark 可用內(nèi)存；

堆外內(nèi)存(Off-heap Memory)

Spark 1.6 開始引入了Off-heap memory(詳見SPARK-11389)。這種模式不在 JVM 內(nèi)申請內(nèi)存，而是調(diào)用 Java 的 unsafe 相關(guān) API 進行諸如 C 語言里面的 malloc() 直接向操作系統(tǒng)申請內(nèi)存，由于這種方式不進過 JVM 內(nèi)存管理，所以可以避免頻繁的 GC，這種內(nèi)存申請的缺點是必須自己編寫內(nèi)存申請和釋放的邏輯。

默認情況下，堆外內(nèi)存是關(guān)閉的，我們可以通過 spark.memory.offHeap.enabled 參數(shù)啟用，并且通過 spark.memory.offHeap.size 設(shè)置堆外內(nèi)存大小，單位為字節(jié)。如果堆外內(nèi)存被啟用，那么 Executor 內(nèi)將同時存在堆內(nèi)和堆外內(nèi)存，兩者的使用互補影響，這個時候 Executor 中的 Execution 內(nèi)存是堆內(nèi)的 Execution 內(nèi)存和堆外的 Execution 內(nèi)存之和，同理，Storage 內(nèi)存也一樣。相比堆內(nèi)內(nèi)存，堆外內(nèi)存只區(qū)分 Execution 內(nèi)存和 Storage 內(nèi)存，其內(nèi)存分布如下圖所示：

如何解析Apache Spark 統(tǒng)一內(nèi)存管理模型

如果想及時了解Spark、Hadoop或者Hbase相關(guān)的文章，歡迎關(guān)注微信公共帳號：iteblog_hadoop

上圖中的 maxOffHeapMemory 等于 spark.memory.offHeap.size 參數(shù)配置的。

Execution 內(nèi)存和 Storage 內(nèi)存動態(tài)調(diào)整

細心的同學肯定看到上面兩張圖中的 Execution 內(nèi)存和 Storage 內(nèi)存之間存在一條虛線，這是為什么呢？

用過 Spark 的同學應(yīng)該知道，在 Spark 1.5 之前，Execution 內(nèi)存和 Storage 內(nèi)存分配是靜態(tài)的，換句話說就是如果 Execution 內(nèi)存不足，即使 Storage 內(nèi)存有很大空閑程序也是無法利用到的；反之亦然。這就導致我們很難進行內(nèi)存的調(diào)優(yōu)工作，我們必須非常清楚地了解 Execution 和 Storage 兩塊區(qū)域的內(nèi)存分布。而目前 Execution 內(nèi)存和 Storage 內(nèi)存可以互相共享的。也就是說，如果 Execution 內(nèi)存不足，而 Storage 內(nèi)存有空閑，那么 Execution 可以從 Storage 中申請空間；反之亦然。所以上圖中的虛線代表 Execution 內(nèi)存和 Storage 內(nèi)存是可以隨著運作動態(tài)調(diào)整的，這樣可以有效地利用內(nèi)存資源。Execution 內(nèi)存和 Storage 內(nèi)存之間的動態(tài)調(diào)整可以概括如下：如何解析Apache Spark 統(tǒng)一內(nèi)存管理模型

如果想及時了解Spark、Hadoop或者Hbase相關(guān)的文章，歡迎關(guān)注微信公共帳號：iteblog_hadoop

具體的實現(xiàn)邏輯如下：

·程序提交的時候我們都會設(shè)定基本的 Execution 內(nèi)存和 Storage 內(nèi)存區(qū)域（通過 spark.memory.storageFraction 參數(shù)設(shè)置）；

·在程序運行時，如果雙方的空間都不足時，則存儲到硬盤；將內(nèi)存中的塊存儲到磁盤的策略是按照 LRU 規(guī)則進行的。若己方空間不足而對方空余時，可借用對方的空間;（存儲空間不足是指不足以放下一個完整的 Block）

·Execution 內(nèi)存的空間被對方占用后，可讓對方將占用的部分轉(zhuǎn)存到硬盤，然后"歸還"借用的空間

·Storage 內(nèi)存的空間被對方占用后，目前的實現(xiàn)是無法讓對方"歸還"，因為需要考慮 Shuffle 過程中的很多因素，實現(xiàn)起來較為復雜；而且 Shuffle 過程產(chǎn)生的文件在后面一定會被使用到，而 Cache 在內(nèi)存的數(shù)據(jù)不一定在后面使用。

注意，上面說的借用對方的內(nèi)存需要借用方和被借用方的內(nèi)存類型都一樣，都是堆內(nèi)內(nèi)存或者都是堆外內(nèi)存，不存在堆內(nèi)內(nèi)存不夠去借用堆外內(nèi)存的空間。

Task 之間內(nèi)存分布

為了更好地使用使用內(nèi)存，Executor 內(nèi)運行的 Task 之間共享著 Execution 內(nèi)存。具體的，Spark 內(nèi)部維護了一個 HashMap 用于記錄每個 Task 占用的內(nèi)存。當 Task 需要在 Execution 內(nèi)存區(qū)域申請 numBytes 內(nèi)存，其先判斷 HashMap 里面是否維護著這個 Task 的內(nèi)存使用情況，如果沒有，則將這個 Task 內(nèi)存使用置為0，并且以 TaskId 為 key，內(nèi)存使用為 value 加入到 HashMap 里面。之后為這個 Task 申請 numBytes 內(nèi)存，如果 Execution 內(nèi)存區(qū)域正好有大于 numBytes 的空閑內(nèi)存，則在 HashMap 里面將當前 Task 使用的內(nèi)存加上 numBytes，然后返回；如果當前 Execution 內(nèi)存區(qū)域無法申請到每個 Task 最小可申請的內(nèi)存，則當前 Task 被阻塞，直到有其他任務(wù)釋放了足夠的執(zhí)行內(nèi)存，該任務(wù)才可以被喚醒。每個 Task 可以使用 Execution 內(nèi)存大小范圍為 1/2N ~ 1/N，其中 N 為當前 Executor 內(nèi)正在運行的 Task 個數(shù)。一個 Task 能夠運行必須申請到最小內(nèi)存為 (1/2N * Execution 內(nèi)存)；當 N = 1 的時候，Task 可以使用全部的 Execution 內(nèi)存。

比如如果 Execution 內(nèi)存大小為 10GB，當前 Executor 內(nèi)正在運行的 Task 個數(shù)為5，則該 Task 可以申請的內(nèi)存范圍為 10 / (2 * 5) ~ 10 / 5，也就是 1GB ~ 2GB的范圍。

一個示例

為了更好的理解上面堆內(nèi)內(nèi)存和堆外內(nèi)存的使用情況，這里給出一個簡單的例子。

只用了堆內(nèi)內(nèi)存

現(xiàn)在我們提交的 Spark 作業(yè)關(guān)于內(nèi)存的配置如下：

--executor-memory 18g

由于沒有設(shè)置 spark.memory.fraction 和 spark.memory.storageFraction 參數(shù)，我們可以看到 Spark UI 關(guān)于 Storage Memory 的顯示如下：如何解析Apache Spark 統(tǒng)一內(nèi)存管理模型

如果想及時了解Spark、Hadoop或者Hbase相關(guān)的文章，歡迎關(guān)注微信公共帳號：iteblog_hadoop

上圖很清楚地看到 Storage Memory 的可用內(nèi)存是 10.1GB，這個數(shù)是咋來的呢？根據(jù)前面的規(guī)則，我們可以得出以下的計算：

systemMemory = spark.executor.memory
reservedMemory = 300MB
usableMemory = systemMemory - reservedMemory
StorageMemory= usableMemory * spark.memory.fraction * spark.memory.storageFraction

如果我們把數(shù)據(jù)代進去，得出以下的結(jié)果：

systemMemory = 18Gb = 19327352832 字節(jié)
reservedMemory = 300MB = 300 * 1024 * 1024 = 314572800
usableMemory = systemMemory - reservedMemory = 19327352832 - 314572800 = 19012780032
StorageMemory= usableMemory * spark.memory.fraction * spark.memory.storageFraction
             = 19012780032 * 0.6 * 0.5 = 5703834009.6 = 5.312109375GB

不對啊，和上面的 10.1GB 對不上啊。為什么呢？這是因為 Spark UI 上面顯示的 Storage Memory 可用內(nèi)存其實等于 Execution 內(nèi)存和 Storage 內(nèi)存之和，也就是 usableMemory * spark.memory.fraction：

StorageMemory= usableMemory * spark.memory.fraction
             = 19012780032 * 0.6 = 11407668019.2 = 10.62421GB

還是不對，這是因為我們雖然設(shè)置了 --executor-memory 18g，但是 Spark 的 Executor 端通過 Runtime.getRuntime.maxMemory 拿到的內(nèi)存其實沒這么大，只有 17179869184 字節(jié)，所以 systemMemory = 17179869184，然后計算的數(shù)據(jù)如下：

systemMemory = 17179869184 字節(jié)
reservedMemory = 300MB = 300 * 1024 * 1024 = 314572800
usableMemory = systemMemory - reservedMemory = 17179869184 - 314572800 = 16865296384
StorageMemory= usableMemory * spark.memory.fraction
             = 16865296384 * 0.6 = 9.42421875 GB

我們通過將上面的 16865296384 * 0.6 字節(jié)除于 1024 * 1024 * 1024 轉(zhuǎn)換成 9.42421875 GB，和 UI 上顯示的還是對不上，這是因為 Spark UI 是通過除于 1000 * 1000 * 1000 將字節(jié)轉(zhuǎn)換成 GB，如下：

systemMemory = 17179869184 字節(jié)
reservedMemory = 300MB = 300 * 1024 * 1024 = 314572800
usableMemory = systemMemory - reservedMemory = 17179869184 - 314572800 = 16865296384
StorageMemory= usableMemory * spark.memory.fraction
             = 16865296384 * 0.6 字節(jié) =  16865296384 * 0.6 / (1000 * 1000 * 1000) = 10.1GB

現(xiàn)在終于對上了。

具體將字節(jié)轉(zhuǎn)換成 GB 的計算邏輯如下(core 模塊下面的 /core/src/main/resources/org/apache/spark/ui/static/utils.js)：

function formatBytes(bytes, type) {
    if (type !== 'display') return bytes;
    if (bytes == 0) return '0.0 B';
    var k = 1000;
    var dm = 1;
    var sizes = ['B', 'KB', 'MB', 'GB', 'TB', 'PB', 'EB', 'ZB', 'YB'];
    var i = Math.floor(Math.log(bytes) / Math.log(k));
    return parseFloat((bytes / Math.pow(k, i)).toFixed(dm)) + ' ' + sizes[i];
}

我們設(shè)置了 --executor-memory 18g，但是 Spark 的 Executor 端通過 Runtime.getRuntime.maxMemory 拿到的內(nèi)存其實沒這么大，只有 17179869184 字節(jié)，這個數(shù)據(jù)是怎么計算的？

Runtime.getRuntime.maxMemory 是程序能夠使用的最大內(nèi)存，其值會比實際配置的執(zhí)行器內(nèi)存的值小。這是因為內(nèi)存分配池的堆部分分為 Eden，Survivor 和 Tenured 三部分空間，而這里面一共包含了兩個 Survivor 區(qū)域，而這兩個 Survivor 區(qū)域在任何時候我們只能用到其中一個，所以我們可以使用下面的公式進行描述：

ExecutorMemory = Eden + 2 * Survivor + Tenured
Runtime.getRuntime.maxMemory =  Eden + Survivor + Tenured

上面的 17179869184 字節(jié)可能因為你的 GC 配置不一樣得到的數(shù)據(jù)不一樣，但是上面的計算公式是一樣的。

用了堆內(nèi)和堆外內(nèi)存

現(xiàn)在如果我們啟用了堆外內(nèi)存，情況咋樣呢？我們的內(nèi)存相關(guān)配置如下：

spark.executor.memory           18g
spark.memory.offHeap.enabled    true
spark.memory.offHeap.size       10737418240

從上面可以看出，堆外內(nèi)存為 10GB，現(xiàn)在 Spark UI 上面顯示的 Storage Memory 可用內(nèi)存為 20.9GB，如下：如何解析Apache Spark 統(tǒng)一內(nèi)存管理模型

如果想及時了解Spark、Hadoop或者Hbase相關(guān)的文章，歡迎關(guān)注微信公共帳號：iteblog_hadoop

其實 Spark UI 上面顯示的 Storage Memory 可用內(nèi)存等于堆內(nèi)內(nèi)存和堆外內(nèi)存之和，計算公式如下：

堆內(nèi)
systemMemory = 17179869184 字節(jié)
reservedMemory = 300MB = 300 * 1024 * 1024 = 314572800
usableMemory = systemMemory - reservedMemory = 17179869184 - 314572800 = 16865296384
totalOnHeapStorageMemory = usableMemory * spark.memory.fraction
                         = 16865296384 * 0.6 = 10119177830
堆外
totalOffHeapStorageMemory = spark.memory.offHeap.size = 10737418240
StorageMemory = totalOnHeapStorageMemory + totalOffHeapStorageMemory
              = (10119177830 + 10737418240) 字節(jié)
              = (20856596070 / (1000 * 1000 * 1000)) GB
              = 20.9 GB

看完上述內(nèi)容，你們對如何解析Apache Spark 統(tǒng)一內(nèi)存管理模型有進一步的了解嗎？如果還想了解更多知識或者相關(guān)內(nèi)容，請關(guān)注億速云行業(yè)資訊頻道，感謝大家的支持。

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
如何用Xd做網(wǎng)頁
下一篇新聞：
如何進行springboot配置templates直接訪問的實現(xiàn)

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機網(wǎng)站二維碼

<td id="uxxqr"><fieldset id="uxxqr"></fieldset></td>

<address id="uxxqr"><dfn id="uxxqr"></dfn></address>