Spark 從 0 到 1 學習(6) —— Spark 記憶體管理

阿新 • • 發佈：2020-10-15

文章目錄

Spark 執行應用程式時，Spark 叢集會啟動 Driver 和 Executor 兩種 JVM程序。Driver 負責建立 SparkContext 上下文，提交任務，排程任務等。Executor 負責 task 的計算任務，並將結果返回給 Driver。同時需要為需要持久化的 RDD 提供儲存。Driver 端的記憶體管理比較簡單，這裡所說的 Spark 記憶體管理針對 Executor 端的記憶體管理。

Spark 記憶體管理分為靜態記憶體管理和統一記憶體管理。Spark1.6 之前使用的是靜態記憶體管理，Spark1.6 之後引入了統一記憶體管理。

1. 靜態記憶體管理

靜態記憶體管理中儲存記憶體/執行記憶體和其他記憶體的大小在 Spark 應用程式執行期間均為固定的，但使用者可以在應用程式啟動前進行配置。

Spark1.6 以上版本預設使用同一記憶體管理，可以通過引數spark.memory.useLegacyMode設定為 true (預設為false) 使用靜態記憶體管理。

1.1 靜態記憶體管理分佈圖

在這裡插入圖片描述

1.2 靜態記憶體管理詳解

60% 的記憶體用於 spark 的儲存。這部分記憶體中 10% 的記憶體用於預留，防止發生 OOM 異常。其他90% 的記憶體用於儲存資料。這90% 的記憶體中 20% 用於解壓縮和序列化資料，剩餘的 80% 的記憶體用於儲存 RDD 的快取資料和廣播變數。

20% 的記憶體用於 spark 的 shuffle。這部分記憶體中 80% 的記憶體用於 shuffle 的聚合，其他 20% 的記憶體是預留記憶體，防止 OOM 異常。
剩餘的記憶體用於 task 的計算。

2. 統一記憶體管理

統一記憶體管理與靜態記憶體管理的區別在於儲存記憶體和執行記憶體共享同一塊空間，可以相互借用對方的空間。

2.1 統一記憶體管理分佈圖

在這裡插入圖片描述

2.2 統一記憶體管理詳解

總記憶體預留出300M，用於JVM自身執行。
剩餘的記憶體中的 60 % 用於 spark ，其中一半用於儲存 RDD 快取資料和廣播變數，另一半用於 shuffle聚合。
剩餘的記憶體中的 40 % 用於 task 的計算。

3. reduce 中 OOM 如何處理？

減少每次拉取的資料量
提高 shuffle 聚合的記憶體比例
提高 Executor 的總記憶體

Spark 從 0 到 1 學習(6) —— Spark 記憶體管理

文章目錄 1. 靜態記憶體管理1.1 靜態記憶體管理分佈圖1.2 靜態記憶體管理詳解

從0開始學習大資料之java spark程式設計入門與專案實踐

本文例項講述了大資料java spark程式設計。分享給大家供大家參考，具體如下：

spark-3.0.1 hadoop 2.10.1 安裝記錄

技術標籤：服務容器DOCKsparkhadoop 計劃做一個s141~s146的分散式。一、製作基本的docker

從0基礎學習MySQL資料庫(五)——終章！

技術標籤：java筆記mysql資料庫 MySQL資料庫技術十六、流程控制結構 1.分類：順序結構：

從0基礎學習MySQL資料庫(三)

技術標籤：筆記java資料庫mysql MySQL資料庫技術十、多表查詢 1.分頁查詢語法：limit 開始的索引，每頁查詢的條數

從0開始學習自動化測試框架cypress(五)總結

技術標籤：jshtmlJava學習自動化測試軟體測試單元測試整合測試測試工具一.下載環境: cypress.zip解壓執行examples或npm install cypress

從0.1開始_Mario_總體設計思路規劃（大綱）

有幾個問題需要解決。我記得一句很經典的話是：C++是找到一個好輪子，C是自己造一個好輪子。我已經做好了準備。

如何從0-1搭建抖音電商團隊？

— 1 — 如何配置團隊？不同時期，不同類目，所需的人員配置都不同，以下團隊架構供參考，需根據自身發展階段、所處類目、預算情況等因素綜合考慮。

Doker從0-1

1、docker思想：它是一種集裝箱的思想，，在以前我們部署一個專案上線的時候，我們要部署各種各樣的環境、配置、依賴等，各種各樣的環境的配置是十分麻煩的，所以就有了docker。他就是將我們的專案和環境配置一起打

C語言學習筆記之記憶體管理

記憶體管理記憶體分割槽普通區域性變數定義 // 區域性變數 // 在{}裡面定義的不加任何修飾的變數就是區域性變數

FreeRTOS --（6）記憶體管理 heap5

轉載自https://blog.csdn.net/zhoutaopower/article/details/106748308 FreeRTOS 中的 heap 5 記憶體管理，相對於 heap 4《FreeRTOS --（5）記憶體管理 heap4》只增加了對非連續記憶體區域的管理，什麼叫非連續區域記