1. 程式人生 > 其它 >淺析為什麼使用redis、redis的4個常見問題、單執行緒redis為什麼快、IO多路複用機制、redis資料型別及應用場景、redis過期策略及記憶體淘汰機制、雙寫一致性問題、如何應對快取穿透/快取雪崩問題、如何解決redis併發競爭key的問題

淺析為什麼使用redis、redis的4個常見問題、單執行緒redis為什麼快、IO多路複用機制、redis資料型別及應用場景、redis過期策略及記憶體淘汰機制、雙寫一致性問題、如何應對快取穿透/快取雪崩問題、如何解決redis併發競爭key的問題

一、為什麼使用 redis

  在專案中使用 redis,主要是從兩個角度去考慮:效能和併發。當然,redis還具備可以做分散式鎖等其他功能,但是如果只是為了分散式鎖這些其他功能,完全還有其他中介軟體(如zookpeer等)代替,並不是非要使用 redis。因此,這個問題主要從效能和併發兩個角度去答。如下所示,分為兩點:

1、效能:我們在碰到需要執行耗時特別久,且結果不頻繁變動的SQL,就特別適合將執行結果放入快取。這樣,後面的請求就去快取中讀取,使得請求能夠迅速響應。

2、併發:在大併發的情況下,所有的請求直接訪問資料庫,資料庫會出現連線異常。這個時候,就需要使用 redis 做一個緩衝操作,讓請求先訪問到 redis,而不是直接訪問資料庫。

二、使用 redis 有什麼缺點

  大家用 redis 這麼久,這個問題是必須要了解的,基本上使用 redis 都會碰到一些問題,常見的也就幾個。主要是四個問題:

1、快取和資料庫雙寫一致性問題

2、快取雪崩問題

3、快取擊穿問題

4、快取的併發競爭問題

  這四個問題在專案中是比較常遇見的。

三、單執行緒的redis為什麼這麼快

  分析:這個問題其實是對 redis 內部機制的一個考察。很多人其實都不知道 redis 是單執行緒工作模型。所以,這個問題還是應該要複習一下的。

  回答:主要是以下三點

1、純記憶體操作

2、單執行緒操作,避免頻繁的上下文切換

3、採用非阻塞 IO 多路複用機制

四、IO 多路複用機制

  我們現在要仔細的說一說 I/O 多路複用機制,因為這個說法實在是太通俗了,通俗到一般人都不懂是什麼意思。打一個比方:小曲在S城開了一家快遞店,負責同城快送服務。小曲因為資金限制,僱傭了一批快遞員,然後小曲發現資金不夠了,只夠買一輛車送快遞。

1、經營方式一:客戶每送來一份快遞,小曲就讓一個快遞員盯著,然後快遞員開車去送快遞。慢慢的小曲就發現了這種經營方式存在下述問題:
  • 幾十個快遞員基本上時間都花在了搶車上了,大部分快遞員都處在閒置狀態,誰搶到了車,誰就能去送快遞
  • 隨著快遞的增多,快遞員也越來越多,小曲發現快遞店裡越來越擠,沒辦法僱傭新的快遞員了
  • 快遞員之間的協調很花時間
  綜合上述缺點,小曲痛定思痛,提出了下面的經營方式。

2、經營方式二:小曲只僱傭一個快遞員。然後呢,客戶送來的快遞,小曲按送達地點標註好,然後依次放在一個地方。最後,那個快遞員依次的去取快遞,一次拿一個,然後開著車去送快遞,送好了就回來拿下一個快遞。

3、對比:上述兩種經營方式對比,是不是明顯覺得第二種,效率更高,更好呢。在上述比喻中:

  • 每個快遞員——————>每個執行緒
  • 每個快遞——————–>每個socket(I/O流)
  • 快遞的送達地點————–>socket的不同狀態
  • 客戶送快遞請求————–>來自客戶端的請求
  • 小曲的經營方式————–>服務端執行的程式碼
  • 一輛車———————->CPU的核數

4、於是我們有如下結論:

(1)經營方式一就是 傳統的併發模型每個I/O流(快遞)都有一個新的執行緒(快遞員)管理

(2)經營方式二就是 I/O多路複用只有單個執行緒(一個快遞員),通過跟蹤每個I/O流的狀態(每個快遞的送達地點),來管理多個I/O流

  下面類比到真實的 redis 執行緒模型,如圖所示:

  參照上圖簡單來說就是:我們的 redis-client 在操作的時候,會產生具有不同事件型別的socket。在服務端,有一段 I/O 多路複用程式,將其置入佇列之中。然後,檔案事件分派器,依次去佇列中取,轉發到不同的事件處理器中。

  需要說明的是,這個I/O多路複用機制,redis還提供了select、epoll、evport、kqueue等多路複用函式庫,大家可以自行去了解。

五、redis 的資料型別,以及每種資料型別的使用場景

  分析:是不是覺得這個問題很基礎,其實我也這麼覺得。然而根據面試經驗發現,至少百分八十的人答不上這個問題。建議,在專案中用到後,再類比記憶,體會更深,不要硬記。基本上,一個合格的程式設計師,五種型別都會用到。

  回答:一共五種基本資料型別,後來又加了3種特殊資料型別,不過沒咋用過。

1、String:這個其實沒啥好說的,最常規的 set/get 操作,value可以是String也可以是數字。一般做一些複雜的計數功能的快取。

2、hash:這裡 value 存放的是結構化的物件,比較方便的就是操作其中的某個欄位。博主在做單點登入的時候,就是用這種資料結構儲存使用者資訊,以cookieId作為key,設定30分鐘為快取過期時間,能很好的模擬出類似session的效果。

3、list:使用List的資料結構,可以做簡單的訊息佇列的功能。另外還有一個就是,可以利用 lrange 命令,做基於 redis 的分頁功能,效能極佳,使用者體驗好。本人還用一個場景,很合適取行情資訊。也就是個生產者和消費者的場景。LIST可以很好的完成排隊,先進先出的原則。

4、set:因為set堆放的是一堆不重複值的集合。所以可以做全域性去重的功能。為什麼不用JVM自帶的Set進行去重?因為我們的系統一般都是叢集部署,使用JVM自帶的Set,比較麻煩,難道為了一個做一個全域性去重,再起一個公共服務,太麻煩了。

  另外,就是利用交集、並集、差集等操作,可以計算共同喜好,全部的喜好,自己獨有的喜好等功能。

5、sorted set:sorted set 多了一個權重引數 score,集合中的元素能夠按 score 進行排列。可以做排行榜應用,取 TOP N 操作。

六、redis 的過期策略以及記憶體淘汰機制

  分析:這個問題其實相當重要,到底redis有沒用到家,這個問題就可以看出來。比如你 redis 只能存5G資料,可是你寫了10G,那會刪5G的資料。怎麼刪的,這個問題思考過麼?還有,你的資料已經設定了過期時間,但是時間到了,記憶體佔用率還是比較高,有思考過原因麼?

  回答:redis採用的是定期刪除+惰性刪除策略

1、為什麼不用定時刪除策略?

  定時刪除,用一個定時器來負責監視key,過期則自動刪除。雖然記憶體及時釋放,但是十分消耗CPU資源。在大併發請求下,CPU要將時間應用在處理請求,而不是刪除key,因此沒有采用這一策略。

2、定期刪除+惰性刪除是如何工作的呢?

  定期刪除,redis 預設每隔100ms檢查,是否有過期的key;有過期 key 則刪除。

  需要說明的是,redis不是每個100ms將所有的key檢查一次,而是隨機抽取進行檢查(如果每隔100ms,全部key進行檢查,redis豈不是卡死)。因此,如果只採用定期刪除策略,會導致很多key到時間沒有刪除。

  於是,惰性刪除派上用場。也就是說在你獲取某個key的時候,redis會檢查一下,這個key如果設定了過期時間那麼是否過期了?如果過期了此時就會刪除

3、採用定期刪除+惰性刪除就沒其他問題了麼?

  不是的,如果定期刪除沒刪除key。然後你也沒即時去請求key,也就是說惰性刪除也沒生效,這樣 redis 的記憶體會越來越高。那麼就應該採用記憶體淘汰機制。

4、記憶體淘汰機制

  在 redis.conf 中有一行配置

# maxmemory-policy volatile-lru

  該配置就是配記憶體淘汰策略的(什麼,你沒配過?好好反省一下自己)

  1)noeviction:當記憶體不足以容納新寫入資料時,新寫入操作會報錯。應該沒人用吧。

  2)allkeys-lru:當記憶體不足以容納新寫入資料時,在鍵空間中,移除最近最少使用的key推薦使用,目前專案在用這種。

  3)allkeys-random:當記憶體不足以容納新寫入資料時,在鍵空間中,隨機移除某個key。應該也沒人用吧,你不刪最少使用Key,去隨機刪。

  4)volatile-lru:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,移除最近最少使用的key。這種情況一般是把 redis 既當快取,又做持久化儲存的時候才用。不推薦

  5)volatile-random:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,隨機移除某個key。依然不推薦

  6)volatile-ttl:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,有更早過期時間的key優先移除。不推薦

  注意:如果沒有設定 expire 的 key,不滿足先決條件(prerequisites);那麼 volatile-lru, volatile-random 和 volatile-ttl 策略的行為和 noeviction(不刪除) 基本上一致。

七、redis 和資料庫雙寫一致性問題

  分析:一致性問題是分散式常見問題,還可以再分為最終一致性和強一致性。資料庫和快取雙寫,就必然會存在不一致的問題。答這個問題,先明白一個前提。就是如果對資料有強一致性要求,不能放快取。我們所做的一切,只能保證最終一致性。另外,我們所做的方案其實從根本上來說,只能說降低不一致發生的概率,無法完全避免。因此,有強一致性要求的資料,不能放快取

  回答:首先,採取正確更新策略,先更新資料庫,再刪快取其次,因為可能存在刪除快取失敗的問題,提供一個補償措施即可,例如利用訊息佇列

八、如何應對快取穿透和快取雪崩問題

  分析:這兩個問題,說句實在話,一般中小型傳統軟體企業,很難碰到這個問題。如果有大併發的專案,流量有幾百萬左右。這兩個問題一定要深刻考慮。

  回答:

1、快取穿透,即黑客故意去請求快取中不存在的資料,導致所有的請求都懟到資料庫上,從而資料庫連線異常。解決方案如下:

(1)利用互斥鎖,快取失效的時候,先去獲得鎖,得到鎖了,再去請求資料庫。沒得到鎖,則休眠一段時間重試。

(2)採用非同步更新策略,無論key是否取到值,都直接返回。value值中維護一個快取失效時間,快取如果過期,非同步起一個執行緒去讀資料庫,更新快取。需要做快取預熱(專案啟動前,先載入快取)操作。

(3)提供一個能迅速判斷請求是否有效的攔截機制,比如,利用布隆過濾器,內部維護一系列合法有效的key。迅速判斷出,請求所攜帶的Key是否合法有效。如果不合法,則直接返回。

2、快取雪崩,即快取同一時間大面積的失效,這個時候又來了一波請求,結果請求都懟到資料庫上,從而導致資料庫連線異常解決方案如下:

(1)給快取的失效時間,加上一個隨機值,避免集體失效。

(2)使用互斥鎖,但是該方案吞吐量明顯下降了。

(3)雙快取。我們有兩個快取,快取A和快取B。快取A的失效時間為20分鐘,快取B不設失效時間。自己做快取預熱操作。然後細分以下幾個小點

  • 1、從快取A讀資料庫,有則直接返回
  • 2、A沒有資料,直接從B讀資料,直接返回,並且非同步啟動一個更新執行緒。
  • 3、更新執行緒同時更新快取A和快取B。

九、如何解決redis的併發競爭key問題

  分析:這個問題大致就是,同時有多個子系統去set一個key。這個時候要注意什麼呢?大家思考過麼。需要說明一下,博主提前百度了一下,發現答案基本都是推薦用 redis 事務機制。博主不推薦使用 redis 的事務機制。因為我們的生產環境,基本都是 redis 叢集環境,做了資料分片操作。你一個事務中有涉及到多個key操作的時候,這多個key不一定都儲存在同一個redis-server上。因此,redis的事務機制,十分雞肋。

  回答如下所示:

1、如果對這個 key 操作,不要求順序

  這種情況下,準備一個分散式鎖,大家去搶鎖,搶到鎖就做set操作即可,比較簡單。

2、如果對這個key操作,要求順序

  假設有一個key1,系統A需要將key1設定為valueA,系統B需要將key1設定為valueB,系統C需要將key1設定為valueC。

  期望按照key1的value值按照 valueA–>valueB–>valueC的順序變化。這種時候我們在資料寫入資料庫的時候,需要儲存一個時間戳。假設時間戳如下

系統A key 1 {valueA  3:00}
系統B key 1 {valueB  3:05}
系統C key 1 {valueC  3:10}

  那麼,假設這會系統B先搶到鎖,將key1設定為{valueB 3:05}。接下來系統A搶到鎖,發現自己的valueA的時間戳早於快取中的時間戳,那就不做set操作了。以此類推。

  其他方法,比如利用佇列,將set方法變成序列訪問也可以。總之可以靈活變通。