1. 程式人生 > 程式設計 >JVM筆記:Java虛擬機器器的記憶體結構

JVM筆記:Java虛擬機器器的記憶體結構

前言

開始先說明一個知識點,Java虛擬機器器的記憶體結構和記憶體模型(JMM)其實是兩個不一樣的東西,前者是下面要講的堆疊之類的內容,後者可以看這篇文章。

由於全域性字串常量池(string pool或string literal pool) 在Java不同的版本中存放在不同的位置,下面以Java8為例。

  • 執行時資料區

    Java虛擬機器器在執行Java程式的過程中會把它管理的記憶體分為若干個資料區域,每個區域都有自己各自的用途和生命週期,有些區域歲虛擬機器器程式的啟動而存在,有些區域則依賴使用者執行緒的啟動和結束而建立和銷燬。 根據 《Java虛擬機器器規範》的規定,Java虛擬機器器所管理的記憶體會包含以下幾個執行時資料區域,如下圖所示。但是要記住這裡只是一種規範,例如方法區是JVM的規範,但Java 1.8以前的**永久代(PermGen space)**和Java 1.8的 **元空間(Metaspace)**則是對這種規範的 實現。

    執行時資料區

  • Java堆

    對大多數應用來說,Java堆(Java Heap)是Java虛擬機器器所管理的記憶體中最大的一塊。Java堆是所有執行緒共享的一塊記憶體區域,在虛擬機器器啟動的時候建立。改記憶體區域的唯一目的就是存放物件例項,幾乎所有的物件例項都在這裡分配記憶體,Java虛擬機器器規範中的描述是:所有物件以及陣列都要在對上分配。但是隨著JIT編譯器的發展和逃逸技術分析技術逐漸成熟,站上非配、標量替換優化技術將會導致一些微妙的變化發生,所有的物件都分配在對上也漸漸的變得不是那麼絕對了。

    Java堆也是垃圾收集器管理的主要區域,因此很多時候也被稱為“GC堆”。目前記憶體回收基本都採用分帶手機演演算法,所以Java堆還可以細分為新生代和老生代

    ,再細一點還可以分為Eden空間From Survivor空間To Survivor空間等。

    因為Java堆是執行緒共享的,所以Java堆可能劃分多個執行緒私有的分配快取區(Thread Local Allocation Buffer =TLAB),不過無論怎麼劃分,其存放的還是物件例項,進一步劃分的目的是為了更好的回收記憶體,或者更快的分配記憶體。(TODO:垃圾回收和記憶體分配)

    根據Java虛擬機器器規範的規定,Java堆可以處於物理上不連續的記憶體空間中,只要邏輯上是連續的即可,就像我們的磁碟空間一樣。在實際操作室,我們可以通過-Xmx和-Xms實現大小擴充套件。 如果堆中沒有足夠的記憶體來分配建立的例項,並且堆也無法再擴充套件時,將會丟擲OutOfMemoryError

    異常。

  • 方法區

    方法區同Java堆一樣,是各個執行緒共享的記憶體區域,主要用於儲存已被虛擬機器器載入的類資訊,常量、靜態變數、即時編譯後的程式碼等資料。雖然Java虛擬機器器規範把方法區描述為對的一個邏輯部分,但是它有一個別名叫Non-Heap(非堆),目的應該是與堆區分開來。

    對於HosSpost來說,更多人把方法區稱為“永久代(PermGen space)”,本質上兩者並不相等,僅僅因為HotSpot虛擬機器器的設計團隊選擇把GC分帶收集擴充套件到方法區,或者說永久代是方法區的一個實現方式。這樣HotSpot的垃圾收集器可以像管理Java堆一樣管理這部分記憶體,能夠節省去專門寫管理方法區記憶體的程式碼的工作,但是如何實現方法區屬於虛擬機器器的實現細節,不受Java虛擬機器器規範約束,類似BEA、JRockit、IBM J9虛擬機器器就不存在永久代的概念。

    Java虛擬機器器規範對方法區的限制非常寬鬆,和Java堆一樣不需要連續的記憶體,可以再JVM啟動時設定固定的大小和可擴充套件,還可以選擇不實現垃圾收集。但是並不意味著資料進入了方法區就如同永久代這個名字一樣“永久”存在了,這個區域的回收目標主要針對常量池的回收和對型別的解除安裝(TODO),一般來說,這部分割槽域的回收的能力相當弱,尤其是型別的解除安裝,條件相當苛刻,但是這部分割槽域回收也確實是必要的。

    永生代的移除從Java7就慢慢開始了,符號引用(Symbols)轉移到了native heap,字面量(interned strings)轉移到了java heap,類的靜態變數(class statics)轉移到了java heap。 在Java8中,用元空間替代了永生代。不同於在堆上分配空間的永生代,元空間的資料儲存在本地記憶體(Native Memory)中,並不存在於虛擬機器器中,這樣也就不會出現OutOfMemoryError異常。

    這裡說一個最重要的點,就是字串常量池,在JDK6的時候存在於永生代中,其記憶體放物件。在JDK7以及以後存在於堆中,其記憶體放字面量(interned strings)和字串在堆上的記憶體地址(也稱字串引用),但String物件是全部處於堆上。用存於本地記憶體的StringTale來儲存字串引用,在呼叫String.intern()時會檢測該字串,如果字串常量池中未存在該字串的引用,新增並儲存改字串在堆上的地址,如果字串常量池中存在引用則直接返回,避免產生新的String的開銷。其結構類似於我們常用的hashtable。

-XX:PermSize
方法區初始大小
-XX:MaxPermSize
方法區最大大小
超過這個值將會丟擲OutOfMemoryError異常:java.lang.OutOfMemoryError: PermGen

-XX:MetaspaceSize 初始空間大小,達到該值就會觸發垃圾收集進行型別解除安裝,同時GC會對該值進行調整:
如果釋放了大量的空間,就適當降低該值;如果釋放了很少的空間,那麼在不超過MaxMetaspaceSize時,適當提高該值。
-XX:MaxMetaspaceSize最大空間,預設是沒有限制的。
-XX:MinMetaspaceFreeRatio在GC之後,最小的Metaspace剩餘空間容量的百分比,減少為分配空間所導致的垃圾收集
-XX:MaxMetaspaceFreeRatio在GC之後,最大的Metaspace剩餘空間容量的百分比,減少為釋放空間所導致的垃圾收集
複製程式碼
  • 程式計數器

    程式計數器是一塊較小的記憶體空間,它可以看做當前執行緒所執行位元組碼的行號指示器。在虛擬機器器的概念模型裡,位元組碼直譯器工作時就是通過改變這個計數器的值來選取下一條需要執行的位元組碼指令,分支、迴圈、跳轉、異常處理、執行緒恢復等基礎功能都需要依賴這個計數器來完成。

    由於Java虛擬機器器的多執行緒是通過執行緒輪流切換並分配處理器執行時間(時間片)來實現的,在仍和一個時刻,一個處理都會執行一個執行緒中的指令。因此,為了執行緒切換後能恢復到正確的執行位置每條執行緒都需要有一個獨立的程式計數器,各個執行緒之間的計數器互不影響,獨立儲存,我們稱這類記憶體區域為“執行緒私有”的記憶體。

    如果執行緒正在執行的是一個Java方法,這個計數器記錄的是正在執行的虛擬機器器位元組碼指令的地址;如果正在執行的是Native方法,這個計數器值則為空(Undenfined)。此記憶體區域是唯一一個在Java虛擬機器器規範中沒有規定任何OOM異常的區域。

  • Java虛擬機器器棧

    同程式計數器一樣,Java虛擬機器器棧也是執行緒私有的,聽他的生命週期與執行緒相同。虛擬機器器棧描述的是Java方法執行的記憶體模型:每個方法在執行的同事都會建立一個棧幀(Stack Frame) 用於儲存區域性變量表、運算元棧、動態連結、方法出口(ReturnAddress)等資訊。每一個方法從呼叫直至執行完成的過程,都對應著一個棧幀在虛擬機器器中入棧到出棧的過程。

    經常有人把Java記憶體區分為堆記憶體(Heap)和棧記憶體(Stack),這種分法比較粗糙,Java記憶體區域的劃分實際上遠比這複雜。這種劃分方式的流行只能說明大多數程式設計師最關注、與物件記憶體分配最密切的記憶體區域是這兩塊。其中所指的“堆”在上面的Java堆有簡要描述,但其內容遠遠不止如此,而“棧”則就是現在所講的虛擬機器器棧,或者說是虛擬機器器棧中區域性變量表部分。

    區域性變量表存放了編譯器可知的各種基本資料型別(boolean、byte、插入、short、int、float、long、double)、物件引用(reference型別,他不等同於物件本身,可能是一個指向物件起始地址的引用指標,也可能是指向一個代表物件的控制程式碼或其他與此物件相關的位置)和returnAddress型別(指向了一條位元組碼指令的地址)。

    在Class檔案中的常量持中存有大量的符號引用。位元組碼中的方法呼叫指令就以常量池中指向方法的符號引用作為引數。這些符號引用一部分在類的載入階段(解析)或第一次使用的時候就轉化為了直接引用(指向資料所存地址的指標或控制程式碼等),這種轉化稱為靜態連結。而相反的,另一部分在執行期間轉化為直接引用,就稱為動態連結。

    其中64位長度的longdouble型別的資料會佔用兩個區域性變數控制元件(Slot),其餘的資料型別只佔用1個。區域性變數所需的記憶體空間在編譯期間完成分配,當進入一個方法時,這個方法需要在棧幀中分配多大的區域性變數空間是完全確定的,在方法執行期間不會改變區域性變量表的大小。

    在Java虛擬機器器規範中,對於這個區域規定了兩種異常狀況:如果執行緒請求的棧深度大於虛擬機器器多允許的深度,將丟擲StackOverflowError異常(最典型的就是遞迴時沒有設定好終止值);如果虛擬機器器棧可以動態擴充套件(當前大部分的Java虛擬機器器都可動態擴充套件,只不過Java虛擬機器器規範中也允許固定長度的虛擬機器器棧),如果擴充套件時無法申請到足夠的記憶體,就會丟擲OutOfMemoryError異常。

  • 本地方法棧

    本地方法棧與虛擬機器器棧所發揮的作用是非常相似的,他們的區別不過是虛擬機器器棧執行Java方法(也就是位元組碼)服務,而本地方法棧則為虛擬機器器使用到Native方法服務。虛擬機器器規範中沒有對本地方法棧中使用的語言、方式和資料結構作強制規定,具體的內容由虛擬機器器自由實現。甚至有的虛擬機器器(Sun HotSpot)直接就把本地方法棧和虛擬機器器棧合二為一。

    與虛擬機器器棧一樣,本地方法棧區域也會丟擲StackOverflowErrorOutOfMemoryError異常。

  • 直接記憶體

    直接記憶體(Direct Memory)並不是虛擬機器器執行時資料區的一部分,也不是Java虛擬機器器規範中定義的記憶體區域。但是這部分記憶體也被頻繁使用,而且也可能導致OutOfMemoryError異常出現,所以這裡簡單描述下。

    在JDK1.4中新加入了NIO(New Input/Output)類,引入了一種基於通道(Channel)和快取區(Buffer)的I/O方式,他可以使用Native函式庫直接分配堆外記憶體,然後通過一個儲存在Java堆中的DirectByteBuffer物件作為這塊記憶體的引用進行操作。這樣能在一些場景生顯著提高效能,因為避免了在JavaNative堆中來回賦值資料。

    顯然,本級直接記憶體的分配不會受到Java堆大小的限制,但是,既然是記憶體,肯定還是會受到本機總記憶體大小以及處理器定址空間的限制。伺服器管理員在配置虛擬機器器引數時,會根據實際記憶體設定-Xmx等引數資訊,但經常忽略記憶體,是的各個記憶體區域綜合大於實體記憶體限制(包括物理的和作業系統級的限制),從而導致動態擴充套件時出現的OutOfMemoryError異常。

  • 總結

    本片內容絕大部分來自於周志明版的深入理解Java虛擬機器器,看了一些系列的文章,發現還是書裡講的比較細且容易懂,這裡只是搬運下,書中執行時常量池這一塊並沒有寫下來,是因為後續想針對這個做一個更詳細的總結。