1. 程式人生 > >如何解決秒殺的效能問題和超賣的討論

如何解決秒殺的效能問題和超賣的討論

  最近業務試水電商,接了一個秒殺的活。之前經常看到淘寶的同行們討論秒殺,討論電商,這次終於輪到我們自己理論結合實際一次了。

  ps:進入正文前先說一點個人感受,之前看淘寶的ppt感覺都懂了,等到自己出解決方案的時候發現還是有很多想不到的地方其實都沒懂,再次驗證了“細節是魔鬼”的理論。並且一個人的能力有限,只有大家一起討論才能想的更周全,更細緻。好了,閒話少說,下面進入正文。

一、秒殺帶來了什麼?

  秒殺或搶購活動一般會經過【預約】【搶訂單】【支付】這3個大環節,而其中【搶訂單】這個環節是最考驗業務提供方的抗壓能力的。

  搶訂單環節一般會帶來2個問題:

  1、高併發

  比較火熱的秒殺線上人數都是10w起的,如此之高的線上人數對於網站架構從前到後都是一種考驗。

  2、超賣

  任何商品都會有數量上限,如何避免成功下訂單買到商品的人數不超過商品數量的上限,這是每個搶購活動都要面臨的難題。

二、如何解決?

  首先,產品解決方案我們就不予討論了。我們只討論技術解決方案

1、前端

  面對高併發的搶購活動,前端常用的三板斧是【擴容】【靜態化】【限流】

  A:擴容

  加機器,這是最簡單的方法,通過增加前端池的整體承載量來抗峰值。

  B:靜態化

  將活動頁面上的所有可以靜態的元素全部靜態化,並儘量減少動態元素。通過CDN來抗峰值。

  C:限流

  一般都會採用IP級別的限流,即針對某一個IP,限制單位時間內發起請求數量。

  或者活動入口的時候增加遊戲或者問題環節進行消峰操作。

  D:有損服務

  最後一招,在接近前端池承載能力的水位上限的時候,隨機拒絕部分請求來保護活動整體的可用性。

2、後端

  那麼後端的資料庫在高併發和超賣下會遇到什麼問題呢?主要會有如下3個問題:(主要討論寫的問題,讀的問題通過增加cache可以很容易的解決)

  I: 首先MySQL自身對於高併發的處理效能就會出現問題,一般來說,MySQL的處理效能會隨著併發thread上升而上升,但是到了一定的併發度之後會出現明顯的拐點,之後一路下降,最終甚至會比單thread的效能還要差。

  II: 其次,超賣的根結在於減庫存操作是一個事務操作,需要先select,然後insert,最後update -1。最後這個-1操作是不能出現負數的,但是當多使用者在有庫存的情況下併發操作,出現負數這是無法避免的。

  III:最後,當減庫存和高併發碰到一起的時候,由於操作的庫存數目在同一行,就會出現爭搶InnoDB行鎖的問題,導致出現互相等待甚至死鎖,從而大大降低MySQL的處理效能,最終導致前端頁面出現超時異常。

  針對上述問題,如何解決呢? 我們先看眼淘寶的高大上解決方案:

  I:  關閉死鎖檢測,提高併發處理效能。

  II:修改原始碼,將排隊提到進入引擎層前,降低引擎層面的併發度。

  III:組提交,降低server和引擎的互動次數,降低IO消耗。

  以上內容可以參考丁奇在DTCC2013上分享的《秒殺場景下MySQL的低效》一文。在文中所有優化都使用後,TPS在高併發下,從原始的150飆升到8.5w,提升近566倍,非常嚇人!!!

  不過結合我們的實際,改原始碼這種高大上的解決方案顯然有那麼一點不切實際。於是小夥伴們需要討論出一種適合我們實際情況的解決方案。以下就是我們討論的解決方案:

  首先設定一個前提,為了防止超賣現象,所有減庫存操作都需要進行一次減後檢查,保證減完不能等於負數。(由於MySQL事務的特性,這種方法只能降低超賣的數量,但是不可能完全避免超賣)

update number set x=x-1 where (x -1 ) >= 0;

解決方案1:

  將存庫從MySQL前移到Redis中,所有的寫操作放到記憶體中,由於Redis中不存在鎖故不會出現互相等待,並且由於Redis的寫效能和讀效能都遠高於MySQL,這就解決了高併發下的效能問題。然後通過佇列等非同步手段,將變化的資料非同步寫入到DB中。

  優點:解決效能問題

  缺點:沒有解決超賣問題,同時由於非同步寫入DB,存在某一時刻DB和Redis中資料不一致的風險。

解決方案2:

  引入佇列,然後將所有寫DB操作在單佇列中排隊,完全序列處理。當達到庫存閥值的時候就不在消費佇列,並關閉購買功能。這就解決了超賣問題。

  優點:解決超賣問題,略微提升效能。

  缺點:效能受限於佇列處理機處理效能和DB的寫入效能中最短的那個,另外多商品同時搶購的時候需要準備多條佇列。

解決方案3:

  將寫操作前移到Memcached中,同時利用Memcached的輕量級的鎖機制CAS來實現減庫存操作。

  優點:讀寫在記憶體中,操作效能快,引入輕量級鎖之後可以保證同一時刻只有一個寫入成功,解決減庫存問題。

  缺點:沒有實測,基於CAS的特性不知道高併發下是否會出現大量更新失敗?不過加鎖之後肯定對併發效能會有影響。

解決方案4:

  將提交操作變成兩段式,先申請後確認。然後利用Redis的原子自增操作(相比較MySQL的自增來說沒有空洞),同時利用Redis的事務特性來發號,保證拿到小於等於庫存閥值的號的人都可以成功提交訂單。然後資料非同步更新到DB中。

  優點:解決超賣問題,庫存讀寫都在記憶體中,故同時解決效能問題。

  缺點:由於非同步寫入DB,可能存在資料不一致。另可能存在少買,也就是如果拿到號的人不真正下訂單,可能庫存減為0,但是訂單數並沒有達到庫存閥值。

三、總結

  1、前端三板斧【擴容】【限流】【靜態化】

  2、後端兩條路【記憶體】+【排隊】

四、非技術感想

  1、團隊的力量是無窮的,各種各樣的解決方案(先不談可行性)都是在小夥伴們七嘴八舌中討論出來的。我們需要讓所有人都發出自己的聲音,不要著急去否定。

  2、優化需要從整體層面去思考,不要只糾結於自己負責的部分,如果只盯著一個點思考,最後很可能就走進死衚衕中了。

  3、有很多東西以為讀過了就懂了,其實不然。依然還是需要實踐,否則別人的知識永遠不可能變成自己的。

  4、多思考為什麼,會發生什麼,不要想當然。只有這樣才能深入進去,而不是留在表面。

  ps:以上僅僅是我們討論的一些方案設想,歡迎大家一起討論各種可行方案。