Redis實踐系列丨Codis資料遷移原理與優化

阿新 • • 發佈：2018-11-16

Codis介紹

Codis 是一種Redis叢集的實現方案，與Redis社群的Redis cluster類似，基於slot的分片機制構建一個更大的Redis節點叢集，對於連線到codis的Redis客戶端來說, 除了部分不支援的命令外，與連線開源的 Redis Server 沒有明顯的區別, 客戶端程式碼基本需要進行修改，Codis-proxy會根據訪問的key進行slot的計算，然後轉發請求到對應的Redis-server，對於客戶端來說，中間的codis-proxy是不可見的，因此根據客戶業務的需要，可以使用codis構建大規模的Redis 服務，或者僅僅是用於把請求分擔多個Redis-server提高系統的吞吐量。

與業界著名的twproxy相比，除了支援Redis的轉發，coids還支援不停機的資料遷移，使使用者可以在容量或者吞吐量要求有變化時，輕鬆進行節點的增減，本文主要對codis的遷移原理進行分析，並提出一個可行的優化點。

本文是基於codis3.0版本。

（圖片來自網路）

Codis遷移實現原理

Codis-dashboard在啟動時，運行了4個後臺執行緒(goroutine)，包括後臺redis狀態同步、proxy狀態同步、slot事件處理、sync事件處理，並提供了slot相關的RestFUL API進行slot與Redis-group歸屬關係的定義、遷移的定義和觸發。

如下結構定義一個slot與Redis-group的歸屬關係和遷移關係，GroupId表示索引為Id的slot所屬的redis-group，而Action用於表示一次遷移，Action.TargetId表示該slot要遷移的目標redis-group的Id，Action.State表示遷移的狀態，主要有Pending、Preparing、Prepared、Migrating、Finished幾種狀態。

type SlotMapping struct {

Id int `json:"id"`

GroupId int `json:"group_id"`

Action struct {

Index int `json:"index,omitempty"`

State string `json:"state,omitempty"`

TargetId int `json:"target_id,omitempty"`

UpdatedAt int64 `json:"updated_at,omitempty"`

} `json:"action"`

}

手動進行一次遷移過程，可以用如下命令來觸發：

codis-admin --dashboard=ADDR -slot-action --create --sid=ID --gid=ID，比如把slot 10遷移到group 5，則可以執行” codis-admin --dashboard=ADDR -slot-action --create --sid=10 --gid=5”

如果是把多個slot遷移到同一個server，則可以使用如下命令，一次性來定義若干個遷移操作，codis-admin --slot-action --create-range --beg=ID --end=ID --gid=ID，比如把slot 10~15遷移到group 5，則可以執行” codis-admin --dashboard=ADDR -slot-action –create--range --beg=10 –end=15 --gid=5”。

一次遷移的執行過程中，slot的Action的狀態會發生變化，過程為：

也可以觸發codis進行rebalance，命令為：codis-admin --dashboard=ADDR –rebalance --confirm，codis會自動把slot往一些新加入的節點進行遷移，使各個節點負責的slot均衡。

Codis遷移的測試

經測試，對於一個64G規模的叢集（由8個節點組成，每個節點8G），使用redis-benchmark寫滿資料，每個key的value長度為32位元組，總共寫入341446298（3.4億）條資料，擴容到128G，即對其中的512個slot進行遷移。

測試結果如下：

從測試結果來看，遷移速度非常慢，每遷移一個slot需要花費基本1個小時，因此使用codis時，需要監控資料量，當資料不夠時，需要進行及時的擴容，否則當空間不夠時的故障處理和恢復時間可能影響線上業務。

Codis遷移程式碼分析及瓶頸分析

從測試結果來看，遷移速度確實非常慢，極端情況下可能會影響線上業務，因此對遷移過程進行分析和優化就很有必要，下邊對關鍵的實現程式碼handleSlotRebalance 、StartDaemonRoutines、ProcessSlotAction進行解讀，並分析優化改進的地方。

01

handleSlotRebalance實現分析

這個函式的主要邏輯分為三部分：

1）找到需要遷移的slot；

2）為每個新節點分配slot；

3）生成遷移操作；

上面的程式碼的邏輯是：

1）根據節點個數和slot槽數(固定的1024)，計算每個節點上應該負責的slot槽數，表示為bound；

2）對每個redis-group，找到需要遷移出去的slot，表示為pending；

生成遷移計劃：

1）遍歷所有的redis-group，對於已有的slot小於應該負責的slot槽數的，就要遷移一些槽進來；

2）所有的redis-group，決定需要遷移進來的slot列表，表示為plans；

遍歷遷移計劃，使用create actionRange生成一系列的slot action，並儲存到etcd，下一步就需要由後臺執行緒去etcd中取出slot操作進行分別處理。

02

StartDaemonRoutines

這個程式碼是在dashboard啟動時就啟動的後臺任務，每隔5秒鐘觸發一次slot操作，且只會執行一個slot操作任務。

03

ProcessSlotAction實現分析

分為兩步Topom.SlotActionPrepare和Topom.processSlotAction。

從上面程式碼可以看出：

下邊再分析processSlotAction的實現：

可以看出：

04

瓶頸分析

從上面的分析可以得出：

這個設計的好處是，遷移過程對客戶業務的影響很小，但是也有一些明顯的缺點：

由於擴容一般會有一定的提前量，且會選在業務低峰期進行，因此可以對該遷移方案進行優化，可以在不對業務訪問造成太大的影響的前提下提高遷移效率。

Codis程式碼優化

根據上面對遷移實現的分析，優化的思路為：

1、Slot遷移並行化

從程式碼實現的分析，有2個點可以選擇：

最終處理程式碼簡單化的考慮，選擇了方案2，同時考慮到如下幾點：

如下優化程式碼，啟動至多10個執行緒進行slot事件的處理。

同時修改SlotActionPrepare，選擇一個狀態為Pending且沒有歸屬於同一個redis-server的slot，進行處理。

2、Multikey遷移

修改redis-server的遷移指令，支援一次遷移多個key，為了靈活性，把遷移的個數從外部傳入，程式碼比較顯而易見，參考如下：

Codis遷移優化測試結果

經過驗證，對於一個64G規模的叢集，使用redis-benchmark寫滿資料，每個key的value長度為32位元組，總共寫入341446298（3.4億）條資料，擴容到128G，即對其中的512個slot進行遷移。最終測試結果為：

因此，經過優化後遷移效能有極大的提升。當然當前的配置也是考慮到了儘量不影響客戶的業務訪問，一次遷移的資料量並不是最大化的，在某些情況下，可以修改配置，一次遷移更多的key，可以更加快速的完成遷移。

Redis實踐系列丨Codis資料遷移原理與優化

Codis介紹 Codis 是一種Redis叢集的實現方案，與Redis社群的Redis cluster類似，基於slot的分片機制構建一個更大的Redis節點叢集，對於連線到codis的Redis客戶端來說, 除了部分不支援的命令外，與連線開源的 Redis Server 沒有明顯的區別, 客戶端程式

企業級Redis開發運維從入門到實踐（20）— Redis複製的原理與優化

什麼是主從複製單機有什麼問題？單機存在機器故障、容量瓶頸、QPS（每秒查詢率）瓶頸的問題。主從複製的作用資料副本擴充套件讀效能；一對一的主從結構一對多的主從結構（主從備份、讀寫分離）

分布式系列文章——Paxos算法原理與推導

rep 參考資料簡單 2-0 iam markdown 自己 cep 決定轉自: https://www.cnblogs.com/linbingdong/p/6253479.html 講得很詳細.貼過來 Paxos算法在分布式領域具有非常重要的地位。但是Pax

大資料技術原理與應用第二章大資料處理架構Hadoop 學習指南

本指南介紹Linux的選擇方案，並詳細指引讀者根據自己選擇的Linux系統安裝Hadoop。請務必仔細閱讀完廈門大學林子雨編著的《大資料技術原理與應用》第2章節，再結合本指南進行學習。Hadoop是基於Java語言開發的，具有很好跨平臺的特性。Hadoop的所要求系統環境適用於Windows，Linux，Ma

大資料技術原理與應用【筆記】

環境前言個人筆記視訊筆記正文大資料思路的轉變：全樣而非抽樣效率而非精確相關而非因果核心技術分散式儲存和分散式處理雲端計算解決了：分散式儲存、分散式處理、虛擬化和多租戶； Hadoo

JDK併發包溫故知新系列（四）—— CAS原理與JDK8的優化

public final int incrementAndGet() { for (;;) { int current = get(); int next = current + 1; if (compareAndSet(current, next))

深入理解flutter的編譯原理與優化

bottom 熱更新 pre ted 符號註釋跟蹤 data 傳遞摘要：閑魚技術-正物問題背景對於開發者而言，什麽是Flutter？它是用什麽語言編寫的，包含哪幾部分，是如何被編譯，運行到設備上的呢？Flutter如何做到Debug模式Hot Reload快速生

android基礎--ListView原理與優化

列表的顯示需要三個元素： ListVeiw: 用來展示列表的View。介面卡 : 用來把資料對映到ListView上資料: 具體的將被對映的字串，圖片，或者基本元件。 &nb

【JVM原理與優化】JVM記憶體設定多大合適？Xmx和Xmn如何設定？

問題: 新上線一個java服務，或者是RPC或者是WEB站點，記憶體的設定該怎麼設定呢？設定成多大比較合適，既不浪費記憶體，又不影響效能呢？分析：依據的原則是根據Java Performance裡面的推薦公式來進行設定。具體來講： Java整

Zookeeper 原理與優化

Zookeeper 是什麼　Zookeeper 是一個基於 Google Chubby 論文實現的一款解決分散式資料一致性問題的開源實現，方便了依賴 Zookeeper 的應用實現資料釋出 / 訂閱、負載均衡、服務註冊與發現、分散式協調、事件通知、叢集管理

ElasticStack系列之二十 & 資料均衡、遷移、冷熱分離以及節點自動發現原理與機制

1. 資料均衡　　某個shard分配到哪個節點上，一般來說，是由 ELasticSearch 自行決定的。以下幾種情況會觸發分配動作：新索引的建立索引的刪除新增副本分片節點增減引發的資料均衡　　在動態分配的時候有幾個預設值需要注意，當然對應的這些預設值都是可以修改的，具

CODIS原理之資料遷移流程[2.X]

作者：鄒祁峰郵箱：[email protected] 部落格：http://blog.csdn.net/qifengzou 日期：2016.08.03 10:42:40 轉載請註明來自”祁峰”的CSDN部落格 CODIS有一個非常重要的特點就是：支援熱擴容。即：在不停止服務的情況下，實

[ 搭建Redis本地服務器實踐系列 ] ：序言

通過工具其中就是壓力接下來業務內置進度說起來，是在一個氣候適宜的下午，雖然臨近下班，不過辦公室裏還是充滿了忙碌的身影，不時的還會從辦公區傳來小夥伴們為了一個需求而激烈爭論的聲音，自從入了互聯網這個行業，說實話，也就很少休息了，當然了也不全然是因為工作壓力大

[ 搭建Redis本地服務器實踐系列一 ] ：圖解CentOS7安裝Redis

文章 centos服務安裝redis 基本虛擬 http 16px entos 自己一章 [ 搭建Redis本地服務器實踐系列 ] ：序言作為開場白介紹了下為什麽要寫這個系列，從這個章節我們就開始真正的進入正題，開始搭建我們本地的Redis服務器。那麽關於Redis

[ 搭建Redis本地服務器實踐系列二 ] ：圖解CentOS7配置Redis

redis配置文件 fir PE .cn 哈哈 else 先來圖解腳本文件上一章 [ 搭建Redis本地服務器實踐系列一 ] ：圖解CentOS7安裝Redis 詳細的介紹了Redis的安裝步驟，那麽只是安裝完成，此時的Redis服務器還無法正常運作，我們需要對其進行

[ 搭建Redis本地服務器實踐系列三 ] ：圖解Redis客戶端工具連接Redis服務器

done not 必須 tin 復雜 start exe eas 方便上一章 [ 搭建Redis本地服務器實踐系列二 ] ：圖解CentOS7配置Redis 介紹了Redis的初始化腳本文件及啟動配置文件，並圖解如何以服務的形式來啟動、終止Redis服務，可以說我們的R

高效運維最佳實踐（03）：Redis叢集技術及Codis實踐 (轉)

專欄介紹 “高效運維最佳實踐”是InfoQ在2015年推出的精品專欄，由觸控科技運維總監蕭田國撰寫，InfoQ總編輯崔康策劃。前言誠如開篇文章所言，高效運維包括管理的專業化和技術的專業化。前兩篇我們主要在說些管理相關的內容，本篇說一下技術專業化。希望讀者朋友們能適應這個轉

資料庫分庫分表(sharding)系列(五) 一種支援自由規劃無須資料遷移和修改路由程式碼的Sharding擴容方案（轉）...

作為一種資料儲存層面上的水平伸縮解決方案，資料庫Sharding技術由來已久，很多海量資料系統在其發展演進的歷程中都曾經歷過分庫分表的Sharding改造階段。簡單地說，Sharding就是將原來單一資料庫按照一定的規則進行切分，把資料分散到多臺物理機（我們稱之為Shard)上儲存，從

ElasticSearch最佳入門實踐（二十八）剖析document資料路由原理

1、document路由到shard上是什麼意思？我們這段，一個index的資料會被分為多片，每個片都在一個shard中，所以說，一個document存在於一個shard中當客戶端建立的時候，es此時就需要決定說，這個document存在於那個shard上。這個過程就稱

資料庫分庫分表 sharding 系列五一種支援自由規劃無須資料遷移和修改路由程式碼的Sharding擴容方案

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！