你所不知道的單例模式和多線程並發在單例模式中的影響
阿新 • • 發佈:2017-06-20
影響 編程問題 rop key 是我 提升 註意 特性 是不是
單例對象(Singleton)是一種常用的設計模式。在Java應用中,單例對象能保證在一個JVM中,該對象只有一個實例存在。這樣的模式有幾個好處: 1、某些類創建比較頻繁,對於一些大型的對象,這是一筆很大的系統開銷。 2、省去了new操作符,降低了系統內存的使用頻率,減輕GC壓力。 3、有些類如交易所的核心交易引擎,控制著交易流程,如果該類可以創建多個的話,系統完全亂了。(比如一個軍隊出現了多個司令員同時指揮,肯定會亂成一團),所以只有使用單例模式,才能保證核心交易服務器獨立控制整個流程。
首先我們寫一個簡單的單例類:
public class Singleton {
/* 持有私有靜態實例,防止被引用,此處賦值為null,目的是實現延遲加載 */
private static Singleton instance = null;
/* 私有構造方法,防止被實例化 */
private Singleton() {
}
/* 靜態工程方法,創建實例 */
public static Singleton getInstance() {
if (instance == null) {
instance = new Singleton();
}
return instance;
}
/* 如果該對象被用於序列化,可以保證對象在序列化前後保持一致 */
public Object readResolve() {
return instance;
}
}
這個類可以滿足基本要求,但是,像這樣毫無線程安全保護的類,如果我們把它放入多線程的環境下,肯定就會出現問題了,如何解決?我們首先會想到對getInstance方法加synchronized關鍵字,如下:
public static synchronized Singleton getInstance() {
if (instance == null) {
instance = new Singleton();
}
return instance;
}
但是,synchronized關鍵字鎖住的是這個對象,這樣的用法,在性能上會有所下降,因為每次調用getInstance(),都要對對象上鎖,事實上,只有在第一次創建對象的時候需要加鎖,之後就不需要了,所以,這個地方需要改進。我們改成下面這個:
public static Singleton getInstance() {
if (instance == null) {
synchronized (instance) {
if (instance == null) {
instance = new Singleton();
}
}
}
return instance;
}
似乎解決了之前提到的問題,將synchronized關鍵字加在了內部,也就是說當調用的時候是不需要加鎖的,只有在instance為null,並創建對象的時候才需要加鎖,性能有一定的提升。但是,這樣的情況,還是有可能有問題的,看下面的情況:在Java指令中創建對象和賦值操作是分開進行的,也就是說instance = new Singleton();語句是分兩步執行的。但是JVM並不保證這兩個操作的先後順序,也就是說有可能JVM會為新的 Singleton實例分配空間,然後直接賦值給instance成員,然後再去初始化這個Singleton實例。這樣就可能出錯了,我們以A、B兩個線程為例: a>A、B線程同時進入了第一個if判斷 b>A首先進入synchronized塊,由於instance為null,所以它執行instance = new Singleton(); c>由於JVM內部的優化機制,JVM先畫出了一些分配給Singleton實例的空白內存,並賦值給instance成員(註意此時JVM沒有開始初始化這個實例),然後A離開了synchronized塊。 d>B進入synchronized塊,由於instance此時不是null,因此它馬上離開了synchronized塊並將結果返回給調用該方法的程序。 e>此時B線程打算使用Singleton實例,卻發現它沒有被初始化,於是錯誤發生了。
可能到了這裏有些朋友可能會問為什麽這樣會出錯???,下面我會詳細的解釋,這些都涉及到java中虛擬機對class文件的處理,虛擬機對java指令的操作。
出現的問題也就是說instance = new Singleton();語句是分兩步執行的。
不太明白為啥初始化那一步不執行完就跳出synchronized塊??
這就是我開始看到這個代碼問的一個問題。
本題涉及幾個知識點。我詳細解釋下。
1.如果你是想在JAVA代碼級別解釋這個問題,那麽你是在浪費時間。這個問題必須到JVM生成的代碼級別討論(很多問題都是這個樣子,在JAVA代碼級別討論不僅浪費時間,而且沒有意義,記得有人跟我說過一句話:在你所處理的層面,問題根本還沒有浮現(非編程問題))。 ------引用自一位大神的解釋
public class TestJVM {
public static void main(String[] args)
{
TestJVM abc = new TestJVM();
}
}
這個代碼用 javap -c 命令反編譯生成下面命令行:
public TestJVM(); Code: 0: aload_0 1: invokespecial #8; //Method java/lang/Object."":()V 4: return public static void main(java.lang.String[]); Code: 0: new #1; //class TestJVM 3: dup 4: invokespecial #16; //Method "":()V 7: astore_1 8: return
下面是一位大神寫的解答:
解釋這段代碼是這道問題的第一步,建議你大概查閱下JVM規範。
(1) new 的含義是創造一塊內存,並且在堆棧上壓入指向這塊內存的引用。
(2) dup的含義是將棧頂復制,並壓入棧。(所以現在有了兩個指向剛才分配內存的引用)
(3) invokespecial意思是將分配的內存中初始化對象。
(4) astore_1是將棧頂壓入本地變量。
(這段過程,我建議你自己多畫幾遍,體會下JVM"面向堆棧"的概念,JVM規範第一章最好看看)
3.上面的四個步驟(絕對的物理過程),其實就是三件事(體會一下原子語句的含義):
a.給實例分配內存。
b.初始化構造器
c.將引用指向分配的內存空間(註意到這步引用就非null了)。
一般來說,我們期望執行的步驟是a->b->c,然而,由於JVM亂序執行的特性(自己查查這句話在哪,別輕易相信別人,雖然有時候文檔也是會騙人的-!-),可能執行的順序是a->c->b。當a->c->b這樣執行時候,假如剛執行完c,這樣線程2訪問這個引用,發現引用不為空,他就對相應的內存做操作,這樣就會發生錯誤,這種錯誤想必不容易發現(那是不是不容易發生?取決於具體的應用環境。)。
4.問題的關鍵用一句話來概括,就是這個意思:if(instance==null),如果instance !=null,那麽instance就真的準備好了麽?
所以,最原始的寫法雖然慢,但是不會產生這種問題,因為原始寫法把判斷是否等於null的語句,也給鎖起來了。只有得到鎖,才有資格判斷
5.上面的幾條,你也許看了第四條,或者大概明白前幾條,你的問題就能解答了。不精確的了解似乎也能回答,但是,有好多誤解就產生了。
比如,有人說,加了valatile類型修飾(JVM1.5以後)符可以將LZ的寫法變對,如private volatile static Singleton instance = null;
其實這是不對的,valatile(LZ想想為什麽valatile影響效率?理解下寄存器和內存的效率差別)無非說的就是線程是不能保留共享對象的本地
拷貝(正常情況線程是可以保留的),那是不是每次去內存中取,就能保證單例對象的正常初始化呢?很明顯,這完全是兩個問題。
6.很多細節問題(編程方面),你都得查查英文文檔,得自己寫試試,中文大家說的話都非常像(因為都是同一本書裏面說的,再加上第一個
人的翻譯水平不咋樣),很多誤解就此產生。
另外一位大神的總結:
1.java寄存器讀寫是無序的,這也是問題的根源。
2.針對這個問題就是在於最外層的if語句不在同步塊中,所以即使下面的同步塊是正確的,且同步塊具有可線性化特性,但是這些都是語言級的功能,換句話說,是java來保證這些同步操作是一個原子操作。所以沒在同步塊中的if有可能拿到一個沒有初始化完全的對象。
3.volatile 只是具備同步刷新寄存器於緩存之間的功能,這個步驟是原子操作。以上面為例,cache = new ConcurrentHashMap(); 這個操作不保證ConcurrentHashMap初始化以完成。但保證指針指向的分配區域所有線程可見。
所以這句話寫成
Map temp = new ConcurrentHashMap();
cache = temp;
同樣存在問題。
這裏是根據現在的解答總結的原因:
我們以A、B兩個線程為例:
a>A、B線程同時進入了第一個if判斷
b>A首先進入synchronized塊,由於instance為null,所以它執行instance = new Singleton();
c>由於JVM內部的優化機制,JVM先畫出了一些分配給Singleton實例的空白內存,並賦值給instance成員(註意此時JVM沒有開始初始化這個實例),然後A離開了synchronized塊。
d>B進入synchronized塊,由於instance此時不是null,因此它馬上離開了synchronized塊並將結果返回給調用該方法的程序。
e>此時B線程打算使用Singleton實例,卻發現它沒有被初始化,於是錯誤發生了。
個人見解:在jvm中,jvm通過.class文件得來的java指令,這些指令在每一個方法中都相當於一個指令集合,每次運行這個方法都會運行這個指令集合。然後對於前面synchronized中的問題代碼:
public static Singleton getInstance() {
if (instance == null) {
synchronized (instance) {
if (instance == null) {
instance = new Singleton();
}
}
}
return instance;
}
其中這個代碼:
synchronized (instance) {
if (instance == null) {
instance = new Singleton();
}
}
我猜測這裏生成的幾個指令在這裏亂序執行,其實前面那位大神也說了是亂序執行。所以當出了synchronized後,還有構造方法未初始化的說法。
通過return指令再結束這個指令集,也就是方法。所以說,這也就能解釋下面的下面(指的是,下面這個單例模式的下面一個單例模式例子)的一個單例模式實例能行,而上面這個單例模式實例不行了。
所以程序還是有可能發生錯誤,其實程序在運行過程是很復雜的,從這點我們就可以看出,尤其是在寫多線程環境下的程序更有難度,有挑戰性。我們對該程序做進一步優化:
private static class SingletonFactory{
private static Singleton instance = new Singleton();
}
public static Singleton getInstance(){
return SingletonFactory.instance;
}
實際情況是,單例模式使用內部類來維護單例的實現,JVM內部的機制能夠保證當一個類被加載的時候,這個類的加載過程是線程互斥的。這樣當我們第一次調用getInstance的時候,JVM能夠幫我們保證instance只被創建一次,並且會保證把賦值給instance的內存初始化完畢,這樣我們就不用擔心上面的問題。同時該方法也只會在第一次調用的時候使用互斥機制,這樣就解決了低性能問題。這樣我們暫時總結一個完美的單例模式:
public class Singleton {
/* 私有構造方法,防止被實例化 */
private Singleton() {
}
/* 此處使用一個內部類來維護單例 */
private static class SingletonFactory {
private static Singleton instance = new Singleton();
}
/* 獲取實例 */
public static Singleton getInstance() {
return SingletonFactory.instance;
}
/* 如果該對象被用於序列化,可以保證對象在序列化前後保持一致 */
public Object readResolve() {
return getInstance();
}
}
其實說它完美,也不一定,如果在構造函數中拋出異常,實例將永遠得不到創建,也會出錯。所以說,十分完美的東西是沒有的,我們只能根據實際情況,選擇最適合自己應用場景的實現方法。也有人這樣實現:因為我們只需要在創建類的時候進行同步,所以只要將創建和getInstance()分開,單獨為創建加synchronized關鍵字,也是可以的:
public class SingletonTest {
private static SingletonTest instance = null;
private SingletonTest() {
}
private static synchronized void syncInit() {
if (instance == null) {
instance = new SingletonTest();
}
}
public static SingletonTest getInstance() {
if (instance == null) {
syncInit();
}
return instance;
}
}
考慮性能的話,整個程序只需創建一次實例,所以性能也不會有什麽影響。 補充:下面再來一個“影子模式”: 采用"影子實例"的辦法具體說,就是在更新屬性時,直接生成另一個單例對象實例,這個新生成的單例對象實例將從數據庫或文件中讀取最新的配置信息;然後將這些配置信息直接賦值給舊單例對象的屬性。
public class GlobalConfig {
private static GlobalConfig instance = null;
private Vector properties = null;
private GlobalConfig() {
//Load configuration information from DB or file
//Set values for properties
}
private static synchronized void syncInit() {
if (instance = null) {
instance = new GlobalConfig();
}
}
public static GlobalConfig getInstance() {
if (instance = null) {
syncInit();
}
return instance;
}
public Vector getProperties() {
return properties;
}
public void updateProperties() {
//Load updated configuration information by new a GlobalConfig object
GlobalConfig shadow = new GlobalConfig();
properties = shadow.getProperties();
}
}
註意:在更新方法中,通過生成新的GlobalConfig的實例,從文件或數據庫中得到最新配置信息,並存放到properties屬性中。上面兩個方法比較起來,第二個方法更好,首先,編程更簡單;其次,沒有那麽多的同步操作,對性能的影響也不大。
通過單例模式的學習告訴我們: 1、單例模式理解起來簡單,但是具體實現起來還是有一定的難度。 2、synchronized關鍵字鎖定的是對象,在用的時候,一定要在恰當的地方使用(註意需要使用鎖的對象和過程,可能有的時候並不是整個對象及整個過程都需要鎖)。 到這兒,單例模式基本已經講完了,結尾處,筆者突然想到另一個問題,就是采用類的靜態方法,實現單例模式的效果,也是可行的,此處二者有什麽不同? 首先,靜態類不能實現接口。(從類的角度說是可以的,但是那樣就破壞了靜態了。因為接口中不允許有static修飾的方法,所以即使實現了也是非靜態的) 其次,單例可以被延遲初始化,靜態類一般在第一次加載是初始化。之所以延遲加載,是因為有些類比較龐大,所以延遲加載有助於提升性能。 再次,單例類可以被繼承,他的方法可以被覆寫。但是靜態類內部方法都是static,無法被覆寫。 最後一點,單例類比較靈活,畢竟從實現上只是一個普通的Java類,只要滿足單例的基本需求,你可以在裏面隨心所欲的實現一些其它功能,但是靜態類不行。從上面這些概括中,基本可以看出二者的區別,但是,從另一方面講,我們上面最後實現的那個單例模式,內部就是用一個靜態類來實現的,所以,二者有很大的關聯,只是我們考慮問題的層面不同罷了。兩種思想的結合,才能造就出完美的解決方案,就像HashMap采用數組+鏈表來實現一樣,其實生活中很多事情都是這樣,單用不同的方法來處理問題,總是有優點也有缺點,最完美的方法是,結合各個方法的優點,才能最好的解決問題!
參考資料:
http://blog.csdn.net/zhangerqing/article/details/8194653
http://www.iteye.com/problems/35251
http://www.cnblogs.com/hxsyl/archive/2013/03/19/2969489.html
你所不知道的單例模式和多線程並發在單例模式中的影響