solrcloud叢集部署二

阿新 • • 發佈：2018-12-03

四、SolrCloud概述

1、單點問題總結

單點的Solr服務缺點：

A：能儲存的資料量有限，如果是海量資料，無法儲存，

B：容易出現單點故障

C：對高併發的處理能力差

2、單點Solr問題解決

1.	把原始的Solr的一個邏輯核心（collection），拆分成多個Shard(分片)，每個分片儲存原始總資料的部分資料

2.	拆分後新的問題：
原始資料切分為多個分片之後，當SolrJ(客戶端)來訪問時，具體訪問哪臺機器上的資料分片呢？
如果當SolrJ來訪問時，填寫具體的IP，那麼當分片足夠多的時候顯然是不可能的，
所以我們引入一個管家，zookeeper，我們通過它來提供資訊，以便於我們訪問這些分散式分片

3、分散式方案問題

多個數據分片組成了一個邏輯的collection，但由於多個分片儲存在多個機器上，如果某臺機器宕機，
那麼勢必會造成資料的不完整，從整體邏輯來說這是不允許的，所以我們對每個分片進行叢集，
在不新增機器的前提下，資料儲存選擇交叉儲存，每臺機器儲存資料分片的一個或者多個副本（replica）。
這樣就形成了SolrCloud的雛形：

說明：

1，	資料量太大，一臺機器放不下，一臺機器的效能不行 
2，	如何分？分原始的collection(核心)，分成一個個shard，只要shard>1就是分散式
3，	由於存在單點故障，所以要對分片shard做叢集操作。只要副本數量>1就是 叢集(多個副本不在同一臺機器)
4，	Collection是邏輯的，由多個shard組成，
5，	Replica副本，可以有多個，只要副本>1並且沒有儲存在同一臺機器就是叢集

4、SolrCloud邏輯結構詳解

說明：

為了實現海量資料的儲存，我們會把索引進行分片（Shard），把分片後的資料儲存到不同Solr節點。

為了保證節點資料的高可用，避免單點故障，我們又會對每一個Shard進行復制，
產生很多副本（Replicas），每一個副本對於一個Solr節點中的一個core

使用者訪問的時候，可以訪問任何一個會被自動分配到任何一個可用副本進行查詢。

Collection：在SolrCloud叢集中邏輯意義上的完整的索引。一般會包含多個Shard（分片），如果大於1個分片，那麼就是分散式儲存。

Shard: Collection的邏輯分片。每個Shard被化成一個或者多個replicas（副本）

Replica: Shard的一個副本，儲存在Solr叢集的某一臺機器中（就是一個節點），
對應這臺Solr的一個Core，如果機器上存放了多個副本，那本機器的solr將有多個core。

Collection和Shard只是邏輯存在的 ，真實存在的只有replica，replica其實就是shard。

分片的數量不要多於機器的數量，3，分片最好不要超過三個

五、Zookeeper分散式協調服務

1、Zookeeper概述

Zookeeper是叢集分散式系統中大管家

分散式集群系統比較複雜，子模組很多，但是子模組往往不是孤立存在的，它們彼此之間需要協作和互動，
各個子系統就好比動物園裡的動物，為了使各個子系統能正常為使用者提供統一的服務，必須需要一種機制來進行協調 —— 這就是ZooKeeper

Zookeeper 是為分散式應用程式提供高效能協調服務的工具集合，
也是Google的Chubby一個開源的實現，是Hadoop 的分散式協調服務

2、Zookeeper叢集結構

在ZooKeeper叢集當中，叢集中的伺服器角色有兩種：1個Leader和多個Follower，具體功能如下：

1）領導者(leader)，負責進行投票的發起和決議，監控叢集中的節點是否存活（心跳機制），進行分配資源
2）follower用於接受客戶端請求並向客戶端返回結果，在選主過程中參與投票

特點：

A：Zookeeper：一個leader，多個follower組成的叢集

B：全域性資料一致（leader主持）：每個server儲存一份相同的資料副本，client無論連線到哪個server，資料都是一致的

C：資料更新原子性，一次資料更新要麼成功。

D：實時性，在一定時間範圍內，client能讀到最新資料， 

E：半數機制：整個叢集中只要有一半以上存活，就可以提供服務。因此通常Zookeeper由2n+1(n>=0)臺servers組成，
每個server都知道彼此的存在。每個server都維護的記憶體狀態映象以及持久化儲存的事務日誌和快照。
為了保證Leader選舉能獲得到多數的支援，所以ZooKeeper叢集的數量一般為奇數。對於2n+1臺server，
只要有n+1臺（大多數）server可用，整個系統保持可用

3、Zookeeeper的leader選主機制

假設有五臺伺服器組成的zookeeper叢集,它們的id從1-5,同時它們都是最新啟動的,也就是沒有歷史資料,在存放資料量這一點上,都是一樣的.假設這些伺服器依序啟動（全新叢集）

1) 伺服器1啟動,此時只有它一臺伺服器啟動了,它發出去的報文 沒有任何響應,所以它的選舉狀態一直是LOOKING狀態

2) 伺服器2啟動,它與最開始啟動的伺服器1進行通訊,互相交換自己的選舉結果,由於兩者都沒有歷史資料,
所以id值較大的伺服器2勝出,但是由於沒有達到超過半數以上的伺服器都同意選舉它(這個例子中的半數以上是

3),所以伺服器1,2還是繼續保持LOOKING狀態.

3) 伺服器3啟動,根據前面的理論分析,伺服器3成為伺服器1,2,3中的老大,而與上面不同的是,
此時有三臺伺服器選舉了它,所以它成為了這次選舉的leader.
	
4) 伺服器4啟動,根據前面的分析,理論上伺服器4應該是伺服器1,2,3,4中最大的,
但是由於前面已經有半數以上的伺服器選舉了伺服器3,所以它只能接收當小弟的命了.

5) 伺服器5啟動,同4一樣,當小弟.

注意：但當叢集節點伺服器裡有資料時、就按資料最新的節點伺服器做為leader

4、Zookeeper的作用

Zookeeper包含一個簡單的原語集，分散式應用程式可以基於它實現：命名服務、配置維護、叢集選主等

命名服務：註冊節點資訊，形成有層次的目錄結構（類似Java的包名）。

配置維護：配置資訊的統一管理和動態切換(solrconfig.xml,schame.xml)

叢集選主：確保整個叢集中只有一個主，其它為從。並且當主掛了後，可以自動選主(同一shard的多個副本之間選主)

不可逆：所有操作都是不可逆的

solrcloud叢集部署二

四、SolrCloud概述 1、單點問題總結單點的Solr服務缺點： A：能儲存的資料量有限，如果是海量資料，無法儲存， B：容易出現單點故障 C：對高併發的處理能力差 2、單點Solr問題解決 1. 把原始的Solr的一個邏輯核心（collection），拆分成多個

solrcloud叢集部署四

七、叢集部署 1、修改tomcat啟動檔案，新增zookeeper的地址資訊修改：tomcat資料夾下的bin目錄中的catalina.sh檔案，新增以下資訊： export JAVA_OPTS="-Dsolr.solr.home=/usr/local/myapp/solr-4.1

solrcloud叢集部署三

六、SolrCloud叢集部署 1、基本環境（1）、我們需要三臺伺服器，也就是三臺虛擬機器。分別是： 192.168.206.101 192.168.206.102

solrcloud叢集部署一

一、叢集概述 1、單點伺服器問題之前學習的JavaEE專案，都是部署在一臺Tomcat上，所有的請求，都由這一臺伺服器處理，存在很大風險： A：併發處理能力有限。因為單伺服器的效能有限制。所以單臺Tomcat的最大連線數有限制， B：容錯率低，一旦伺服器故障，整個服務就無法訪問了

K8s叢集部署（二）------ Master節點部署

Master節點要部署三個服務：API Server、Scheduler、Controller Manager。 apiserver提供叢集管理的REST API介面，包括認證授權、資料校驗以及叢集狀態變更等　　只有API Server才直接操作etcd 　　其他模組通過API Server查詢

MySQL+MMM 高可用叢集部署（二）

接上期，MySQL主從同步我們已經部署完成，接下來，我們開始部署本期的核心---MMM高可用叢集四、MMM高可用叢集部署 1、安裝依賴包由於mmm 是用perl語言寫的指令碼程式，因此需要在5臺伺

Docker(二十)-Docker Swarm叢集部署

介紹 Swarm 在 Docker 1.12 版本之前屬於一個獨立的專案，在 Docker 1.12 版本釋出之後，該專案合併到了 Docker 中，成為 Docker 的一個子命令。目前，Swarm 是 Docker 社群提供的唯一一個原生支援 Docker 叢集管理的工具。它可以把多個 Docker 主

《二》Kubernetes叢集部署(node)-搭建單叢集v1.1

在Node節點部署元件 Master apiserver啟用TLS認證後，Node節點kubelet元件想要加入叢集，必須使用CA簽發的有效證書才能與apiserver通訊，當Node節點很多時，簽署證書是一件很繁瑣的事情，因此有了TLS Bootstrapping機制，kubelet會以一個低許可權使用者

《二》Kubernetes叢集部署-搭建叢集

多master叢集架構圖時間必須同步、關閉防火牆、Firewalld、selinux 1、拷貝master01 中的kubernetes目錄到master02上[[email protected] ~]# scp -r /opt/kubernetes/ 192.168.1.16:/op

架構系列二：使用Nginx+tomcat實現叢集部署

在前面的一篇文章《架構系列一：系統架構的演變》中，簡單介紹了系統架構的演變，從單機到叢集部署，現在的企業級專案，可以說99.99%以上的專案，都是叢集部署，當叢集中的一個節點出現故障，會自動切換另一個節點，實現故障自動轉移，現在就基於Nginx+tomcat搭建

【Docker】基於例項專案的叢集部署（二）部署專案例項介紹與搭建

部署專案簡介我們要部署的專案是人人網的一個基於前後端分離的專案：renren-fast。你可以在這裡對該專案進行下載，並對相關介紹文件進行了解： https://www.renren.io/community/project https://www.renren.io/guide

Cloudera 5.7叢集部署（二）--CM、CDH安裝

1 Cloudera安裝配置 1.1 安裝前注意事項前期在fengkongj上操作，再將配置好的安裝包拷給fengkongb,fengkongc,fengkongd,fengkonge, fengkongf, fengkongg, feng

Kafka（二）： Kafka 叢集部署與使用

一、Kafka 叢集部署 Kafka是一種分散式的釋出（producer）/訂

對SolrCloud叢集Collection進行手動二次Sharding

只有shard1有一個副本，並且位於不同的節點上。隨著索引資料量的增長，如果我們的Collection的每個分片都不斷的增大，最後導致單個分片在搜尋的時候，相應速度成為瓶頸，那麼，我們要考慮將每個分片再次進行分片。因為第一次系統規劃時已經設定好分片數量，所以每個分片所包含的Document數量幾乎是相同的

RocketMQ（二）——叢集部署

在Metaq1.x/2.x的版本中，分散式協調採用的是Zookeeper，而RocketMQ自己實現了一個NameServer，所以RocketMQ啟動時，先啟動對應的NameServer。叢集部署方式 RocketMQ部署比較靈活，推薦幾種Br

使用Minikube部署本地Kubernetes叢集（二十八）

前言使用Minikube部署本地k8s叢集相對比較簡單，非常推薦將其用於本地k8s開發環境，唯一麻煩點的僅僅是網路問題。在本篇教程中，我們使用了國內的映象來完成本地k8s叢集的搭建。如果搭建過

rocketmq學習(二) rocketmq叢集部署與圖形化控制檯安裝

1.rocketmq圖形化控制檯安裝　　雖然rocketmq為使用者提供了使用命令列管理主題、消費組以及broker配置的功能，但對於不夠熟練的非運維人員來說，命令列的管理介面還是較難使用的。為此，我們可以使用圖形化的管理介面來簡化管理操作。　　rocketmq官方推薦的圖形化控制檯目前還處在不成熟的孵化

bluemix部署(二）構建kubernetes工作環境

復制 clust body 地址 boa nta 空間 started containe 本文接上篇。在bluemix中構建kubernetes容器。 1.創建集群左上角的三橫，選容器，然後創建集群。註意區域，免費版，給個名字，創建集群吧。繼續正在部署，這個

LAMP部署-- 二.編譯安裝Mysql

lamp mysql 數據庫 LAMP組件介紹 LAMP是指Linux、Apache，Mysql以及PHP的簡稱，目前許多生產環境的都是用的LAMP架構，在網絡應用和開發環境方面，LAMP組合是非常棒的，它們的結合提供了強大的功能。 Linux作為底層的操作系統，提供了靈活且安全的應用平臺，為其

探秘 Java 熱部署二（Java agent premain）

業務方法 instr 自己就是還要是我 java 代理命令 # 前言在前文探秘 Java 熱部署中，我們通過在死循環中重復加載 ClassLoader 和 Class 文件實現了熱部署的功能，但我們也指出了缺點-----不夠靈活。需要手動修改文件等操作。

solrcloud叢集部署 二

四、SolrCloud概述

1、單點問題總結

2、單點Solr問題解決

3、分散式方案問題

說明：

4、SolrCloud邏輯結構詳解

五、Zookeeper分散式協調服務

1、Zookeeper概述

2、Zookeeper叢集結構

3、Zookeeeper的leader選主機制

4、Zookeeper的作用

相關推薦

solrcloud叢集部署二