Cassandra Vnodes在Cassandra 2.0-4.0中的演進

阿新 • • 發佈：2020-09-11

Vnodes簡短歷史

Vnodes又叫Virtual Nodes。是Cassandra在1.2版本里引入的功能，已經在生產環境中使用了近8年了。從2.0版本開始，因為預設配置裡num_tokens一般會設成256，所以如果你沒有修改過預設引數，那很有可能你一直都在使用這個功能。

當初引入vnodes主要是為了改善增加節點時的靈活性。在pre-1.2時代（也就是沒有vnodes功能的時候），每次叢集擴容都必須要讓節點數翻倍，比如3個節點擴容到6個節點，下次需要擴容的時候再增加到12個節點。這是因為每個節點都只擁有一個token範圍，增加新節點的時候就是把每個token範圍一分為二，讓每個新節點都負責一半的token範圍。但是，如果要保證整個叢集的token範圍是均勻分佈的，每次新增加的節點數需要跟已有的節點數一致。這樣每次翻倍的擴容方式顯然對運維和資源計劃造成了很大的挑戰。

有了vnodes以後，預設情況下每個物理節點會負責256個token範圍，增加一個新的節點只需要從每個已有節點的256個token範圍中取出若干個，合起來湊成256個新token範圍分配給新來的節點就好了。整個叢集的token範圍分佈還是均勻的。

Vnodes功能在1.2版推出以後，受到了廣大生產環境Cassandra運維人員的歡迎，所以在2.0版裡，vnodes功能被預設啟用，而且這個num_tokens引數預設的被配置成了256。

Vnodes帶來的問題

可是，隨著越來越多的Cassandra叢集開始在生產環境裡使用vnodes，它的一些不盡如人意的地方逐漸開始體現出來。

最大的一個問題，體現在執行nodetool repair的時候：因為repair是按照節點的token範圍來安排一個個的小任務，以進行副本之間的比較和修復工作；一個節點擁有的token範圍的數量越多，這樣的小任務就越多；當一個節點擁有了256個token範圍，並且儲存了幾百GB資料的時候，每個keyspace的repair小任務加起來所花的時間動輒就會達到幾小時甚至數天；生產環境中一般會有幾個keyspace，再加上nodetool repair -pr需要10天之內在所有的節點上都執行一輪，這會對運維帶來比較大的困難。

另外，當一個節點擁有了256個token範圍時，增加新節點的bootstrap過程也會帶來多得多的SSTable數量，需要消耗大量的CPU才能把這些大量的小SSTable消化掉。

比較棘手的是，這些問題並不是簡單的在配置中降低num_tokens取值就可以解決的。把num_tokens設定成一個更小的值比如16，當然會大大改善repair和bootstrap，但是這樣面臨著兩個主要的挑戰：

Cassandra 1.2原有的vnodes演算法設計一般假設每個節點會有數百個token範圍，使用的是隨機重新分配的演算法，token範圍數量多的時候沒問題，但是token範圍數量降低到十幾個的時候，很容易出現數據不均勻分配的情況(如下圖所示)，而且節點增加的越多，這種不均勻的現象會越嚴重；

一個數據中心的vnodes數量在資料中心初始化的時候就確定了，將來想要改的話，只能啟用新的資料中心遷移資料。

Datacenter: us-east-1
=====================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address        Load   	  Tokens   	Owns (effective)  Host ID                               Rack
UN  172.1*.3*.1*   1.55 TiB    16       	4.1%          	f683ab0e-a687-400f-80fb-28f7b4471ffc  b
UN  172.1*.3*.1**  1.05 TiB    16       	2.9%          	2097cd01-4161-44a9-a944-d5445e8c5e02  c
UN  172.1*.3*.2*   720.26 GiB  16       	3.0%  	        e6593e3a-bb1c-499c-a99b-73781cfcd076  c
UN  172.1*.3*.2*   1.3 TiB     16       	4.0%          	99670a7c-a55f-4a43-8e4b-a3cccc71f08f  a
UN  172.1*.3*.1**  961.67 GiB  16       	3.2%          	a4bb1648-3582-4f05-a1e6-3125e9c3c46c  b
UN  172.1*.3*.1**  1.29 TiB    16       	4.4%          	890e98d3-d88d-4d8c-89b4-7e9444bb69be  a
UN  172.1*.3*.2*   1.42 TiB    16       	4.0%          	3f2817da-9dc5-4122-8977-5d3d93669b4e  c
UN  172.1*.3*.1**  710.53 GiB  16       	4.9%       	72405162-f121-46d4-a220-a1fd2db868e8  b
UN  172.1*.3*.3*   2.38 TiB    16       	7.1%          	f15c768c-0175-4646-bc68-7b20a74d7f0d  b
UN  172.1*.3*.1**  2.68 TiB    16       	7.3%          	2f444803-7787-474a-9ed9-8555147023d3  c
UN  172.1*.3*.1**  1.59 TiB    16       	5.2%          	bd838966-23e2-44b2-986c-729ede679604  c
UN  172.1*.3*.5*   808.48 GiB  16       	4.3%          	1fe83c82-1fb2-4570-9aae-7805370f24b0  b

新版本是怎樣解決問題的

針對上面提到的第一個挑戰，Cassandra 3.0裡啟用了新的token分配演算法，並且增加了一個新的引數allocate_tokens_for_keyspace，這個貪心演算法雖然不能完全避免token範圍熱點的情況出現，但是它的最大好處是，在叢集中繼續增加節點的話，token範圍的熱點會越來越少，資料分配會越來越均勻。

Cassandra 4.0在此基礎之上又做了更多的改進，3.0裡的引數allocate_tokens_for_keyspace將被allocate_tokens_for_local_replication_factor取代。這樣配置的工作更加簡單，因為不再需要在初始化一個數據中心的時候提供一個keyspace的名字。

有了這樣演算法的加持，社群也逐漸開始建議所有使用者在新建資料庫的時候，把num_tokens引數直接改成一個比256小得多的取值。最新的討論可以看這個JIRA和這個郵件列表的討論。社群現在達成的共識是在4.0版本中把預設的num_tokens設定成16，並且預設啟用新的token分配演算法。如果4.0 release測試過程不再發現新的問題，在4.0正式版釋出以後，所有執行新版本的叢集將會是每節點擁有16個token範圍，以兼顧運維操作的高效，和資料分配的均勻。

Cassandra Vnodes在Cassandra 2.0-4.0中的演進

Vnodes簡短歷史 Vnodes又叫Virtual Nodes。是Cassandra在1.2版本里引入的功能，已經在生產環境中使用了近8年了。從2.0版本開始，因為預設配置裡num_tokens一般會設成256，所以如果你沒有修改過預設引數，那很有可能

Redis 2.8-4.0過期鍵優化過程全紀錄

前言之前白馨(陌陌-技術保障部儲存工程師 )在Redis技術交流群裡，總結了一下Redis從2.8~4.0關於過期鍵相關的fix記錄，非常有幫助，但有些東西未盡詳細，本文將進行詳細說明。

Red Hat Enterprise Linux 6上安裝Oracle 11G(11.2.0.4.0)缺少pdksh包的問題

RHEL 6上安裝Oracle 11G警告缺少pdksh包前言相信很多剛剛接觸學習Oracle的人，在RHEL6上安裝11.2.0.3 or 11.2.0.4這兩個版本的時候，

centos7.5+ambari-2.7.4.0部署安裝

--環境資訊： namenodemaster.hadoop 公網：122.225.77.45 內網：192.168.1.45 yarnserver.hadoop 公網：122.225.77.46

win7環境下安裝Weblogic12.2.1.4.0

win7環境下安裝Weblogic12.2.1.4.0 寫在前面最近因為想復現一下weblogic的CVE-2020-2555和CVE-2020-2883漏洞，需要weblogic環境，但是vulhub上沒有相應的，docker裡pull下來的嘗試了很久啟動一直報錯....無奈只能蹦

ORACLE LINUX 7.7 安裝ORACLE 11.2.0.4.0 RAC

環境：oracle linux7.7，安裝系統時需雙網絡卡，接心跳線。　節點一(rac1)：　　網絡卡一：10.244.186.189　　網絡卡二：192.168.1.101　節點二(rac2)：　　網絡卡一：10.244.186.220　　網絡卡二：192.168.1.103

《命運2》4.0.0.1版本更新介紹 2月23日更新介紹

《命運2》在2月23日釋出了新的DLC邪姬魅影，同時遊戲也迎來了大量的更新，想要了解更新內容的玩家請看下面官方釋出的《命運2》4.0.0.1版本更新介紹，希望能夠幫助大家。

Maven配置ojdbc14-10.2.0.4.0.jar

對於oralce的jdbc驅動，在maven上搜索到把pom配置複製到pom.xml裡進行引用的時候出現下面這種情況

Sentinel Go 0.4.0 釋出，支援熱點流量防護能力

Sentinel 是阿里巴巴開源的，面向分散式服務架構的流量控制組件，主要以流量為切入點，從限流、流量整形、熔斷降級、系統自適應保護等多個維度來幫助開發者保障微服務的穩定性。Sentinel 承接了阿里巴巴近 10 年的雙

vue-cli3.0/4.0搭建專案

vue-cli3.0/4.0 以後專案建立的命令變成了下面這樣 vue create <Project Name> //檔名不支援駝峰（含大寫字母）

webmagic 0.4.0的特性

0.4.0已釋出，新聞：http://www.oschina.net/news/45720/webmagic-0-4-0 webmagic 0.4.0將於本週內釋出，新增特性：

vue-cli2.0/3.0/4.0建立專案的方式差異解讀和vue-cli4.0打包命令和環境配置

vue-cli2.x和vue-cli3.x 或者 vue-cli4.x 差異不能說非常大但是簡潔了許多和看起來清爽了許多更方便使用了；準備工作先分析再來實踐

KubeDL 0.4.0 - Kubernetes AI 模型版本管理與追蹤

歡迎更多的使用者試用 KubeDL，並向我們提出寶貴的意見，也期待有更多的開發者關注以及參與 KubeDL 社群的建設！

Springboot升級至2.4.0中出現的跨域問題分析及修改方案

問題 Springboot升級至2.4.0中出現的跨域問題。在Springboot 2.4.0版本之前使用的是2.3.5.RELEASE，對應的Spring版本為5.2.10.RELEASE。

Oracle 11.2.0.4打補丁的方法

所需補丁及高版本opatch image上傳後將p6880880_112000_Linux-x86-64.zip解壓覆蓋$ORACLE_HOME/OPatch目錄即可

Linux 7.4上安裝配置Oracle 11.2.0.4圖文教程

1. 配置Yum源及關閉SeLinux [root@localhost ~]# mkdir /media/rhel [root@localhost ~]# mount /dev/cdrom /media/rhel

CentOS 7.4下安裝Oracle 11.2.0.4資料庫的方法

在Linux下安裝Oracle資料庫是一件較為麻煩的事情。由於Linux的安裝過程中可能會選擇不同的安裝包，會導致Oracle安裝過程中缺失或多一些軟體包，很難一次性的安裝成功。所以，本文詳細記錄了Oracle在Linux上的安裝過

Android Studio 4.0 正式釋出在Ubuntu 20.04中安裝的方法

Android Studio 4.0 已經發布了。以下是在Ubuntu 18.04，Ubuntu 19.10，Ubuntu 20.04中安裝它的方法。

Android Studio 4.0 新功能中的Live Layout Inspector詳解

最近 Android Studio 4.0 穩定版本正式釋出，其中一個重要升級就是新版的Layout Inspector

[備忘錄]npm中執行shell指令碼提示： git commit -m "add " husky > npm run -s precommit (node v14.4.0) '.' 不是內部或外部命令，也不是可執行的程式或批處理檔案。 husky > pre-commit hook failed (add --no-ver

[備忘錄]npm中執行shell指令碼提示： git commit -m "add " husky > npm run -s precommit (node v14.4.0)\'.\' 不是內部或外部命令，也不是可執行的程式或批處理檔案。husky > pre-commit hook fa

Cassandra Vnodes在Cassandra 2.0-4.0中的演進

Vnodes簡短歷史

Vnodes帶來的問題

新版本是怎樣解決問題的

相關推薦