大資料系列之分散式釋出訂閱訊息系統Kafka（一）Kafka簡介，組成，叢集安裝

阿新 • • 發佈：2019-01-27

1.Kafka簡介

Kafka如同JMS(Java Message Service)一樣，是一箇中間件，在異構系統間通訊，為不同的系統之間提供服務。我們知道JMS通過佇列（一對一）與主題（一對多）兩種形式提供服務，而Kafka則通過主題（topic），來給一組消費者提供服務，但是這一組消費者中只能有一個消費者消費，這樣就將JMS的佇列與主題提供的服務整合在一起（一對一：針對一組消費者裡的一個消費者，一對多：針對多組消費者）。

Kafka是由Apache軟體基金會開發的一個開源流處理平臺，由Scala和Java編寫。Kafka是一種高吞吐量的分散式釋出訂閱訊息系統，它可以處理消費者規模的網站中的所有動作流資料。這種動作（網頁瀏覽，搜尋和其他使用者的行動）是在現代網路上的許多社會功能的一個關鍵因素。這些資料通常是由於吞吐量的要求而通過處理日誌和日誌聚合來解決。對於像

Hadoop的一樣的日誌資料和離線分析系統，但又要求實時處理的限制，這是一個可行的解決方案。Kafka的目的是通過Hadoop的並行載入機制來統一線上和離線的訊息處理，也是為了通過叢集來提供實時的訊息。

Kafka是一個分散式流處理平臺，在不同的系統之間構建實時的資料流通管道。以主題（topic）分類對記錄進行儲存。每個記錄包含key-value+timestamp，每秒鐘百萬訊息吞吐量。

2.Kafka組成

producer           //訊息生產者
   consumer           //訊息消費者
   consumer group       //消費者組
   kafka server       //broker,kafka伺服器
   topic               //主題
   zookeeper           //系統服務

3..Kafka叢集安裝

0.選擇s10 ~ s12三臺主機安裝kafka
   1.準備zk（之前已經配置）
       略
   2.jdk（之前已經配置）
       略
   3.tar檔案

tar -zxvf kafka_2.11-0.10.2.1

建立符號連結： ln -s kafka_2.11-0.10.2.1 kafka
4.環境變數[/etc/profile]

#kafka
export KAFKA_HOME=/home/zpx/soft/kafka
export PATH=$PATH:$KAFKA_HOME/bin

source /etc/profile
   5.配置kafka
       [kafka/config/server.properties]
       ...
       broker.id=10
       ...
       listeners=PLAINTEXT://:9092
       ...
       log.dirs=/home/zpx/kafka/logs
       ...
       zookeeper.connect=s10:2181,s11:2181,s12:2181

   6.分發server.properties到所有的主機節點上，同時修改每個檔案的broker.id（我設定3個數值是10,11,12）

   7.啟動kafka伺服器
       a)先啟動zk
       b)啟動kafka（前提是已經開啟zookeeper）
           [s10 ~ s12]

如下啟動之後會阻塞
$>bin/kafka-server-start.sh config/server.properties

建議使用如下方式，在後臺執行：

$> kafka-server-start.sh -daemon ../config/server.properties

c)驗證kafka伺服器是否啟動
$>netstat -anop | grep 9092

軟體包：

連結：https://pan.baidu.com/s/1SJC_huvlp1_4bHHiBse8jA 密碼：nsv5

大資料系列之分散式釋出訂閱訊息系統Kafka（一）Kafka簡介，組成，叢集安裝

大資料系列之分散式釋出訂閱訊息系統Kafka（一）Kafka簡介，組成，叢集安裝

大資料系列之分散式釋出訂閱訊息系統Kafka（四）Kafka與Flume的3種整合

RocketMQ中介軟體訊息佇列在Maven專案中的配置使用操作 (分散式釋出訂閱訊息系統)

Kafka-API中介軟體MQ訊息佇列在Maven專案中的配置使用操作 (分散式釋出訂閱訊息系統)

分散式釋出訂閱訊息系統Kafka

分散式釋出訂閱訊息系統 Kafka

Kafka（分散式釋出訂閱訊息系統）

分散式釋出訂閱訊息系統 Kafka 架構設計

分散式釋出訂閱訊息系統—Apache Kafka

Arduino系列之超聲波測距模塊代碼（一）

【Android 進階】仿抖音系列之翻頁上下滑切換視訊（一）

大資料分析中國冬季重度霧霾的成因（一）

算法系列之二十：計算中國農曆（一）

Cris 玩轉大資料系列之訊息佇列神器 Kafka

ActiveMQ實戰之 Topic釋出訂閱訊息

大資料系列之——hive（七、hive詳解及應用）

大資料系列之hive（八、hive內建函式全解）

大資料筆記之分散式檔案系統HDFS筆記一

大資料筆記之分散式檔案系統HDFS筆記二

前端非同步程式設計系列之事件釋出/訂閱模式（2/4）

大資料系列之分散式釋出訂閱訊息系統Kafka（一）Kafka簡介，組成，叢集安裝

相關推薦