Flume基礎（十一）：自定義 Interceptor

阿新 • • 發佈：2020-07-27

1）案例需求使用 Flume 採集伺服器本地日誌，需要按照日誌型別的不同，將不同種類的日誌發往不同的分析系統。 2）需求分析　　在實際的開發中，一臺伺服器產生的日誌型別可能有很多種，不同型別的日誌可能需要傳送到不同的分析系統。此時會用到 Flume 拓撲結構中的 Multiplexing 結構，Multiplexing的原理是，根據 event 中 Header 的某個 key 的值，將不同的 event 傳送到不同的 Channel中，所以我們需要自定義一個 Interceptor，為不同型別的 event 的 Header 中的 key 賦予不同的值。　　在該案例中，我們以埠資料模擬日誌，以數字（單個）和字母（單個）模擬不同型別的日誌，我們需要自定義 interceptor 區分數字和字母，將其分別發往不同的分析系統（Channel）。 3）實現步驟 1.建立一個 maven 專案，並引入以下依賴。

<dependency>
 <groupId>org.apache.flume</groupId>
 <artifactId>flume-ng-core</artifactId>
 <version>1.7.0</version>
</dependency>

2.定義 CustomInterceptor 類並實現 Interceptor 介面。

package com.atguigu.flume.interceptor;
import org.apache.flume.Context;
import org.apache.flume.Event;
import org.apache.flume.interceptor.Interceptor;
import java.util.List;
 
public class CustomInterceptor implements Interceptor {
 @Override
 public void initialize() {
 }
 @Override
 public Event intercept(Event event) {
 byte[] body = event.getBody();
 if (body[0] < 'z' && body[0] > 'a') {
 event.getHeaders().put("type", "letter");
 } else if (body[0] > '0' 
 && body[0] < '9') {
 event.getHeaders().put("type", "number");
 }
 return event;
 }
 @Override
 public List<Event> intercept(List<Event> events) {
 for (Event event : events) {
 intercept(event);
 }
 return events;
 }
 @Override
 public void close() {
 }
 public static class Builder implements Interceptor.Builder {
 @Override
  
public Interceptor build() {
 return new CustomInterceptor();
 }
 @Override
 public void configure(Context context) {
 }
 } }

3.編輯 flume 配置檔案為 hadoop102 上的 Flume1 配置 1 個 netcat source，1 個 sink group（2 個 avro sink），並配置相應的 ChannelSelector 和 interceptor。

# Name the components on this agent
a1.sources = r1
a1.sinks = k1 k2
a1.channels = c1 c2
# Describe/configure the source
a1.sources.r1.type = netcat
a1.sources.r1.bind = localhost
a1.sources.r1.port = 44444
a1.sources.r1.interceptors = i1
a1.sources.r1.interceptors.i1.type = 
com.atguigu.flume.interceptor.CustomInterceptor$Builder
a1.sources.r1.selector.type = multiplexing
a1.sources.r1.selector.header = type
a1.sources.r1.selector.mapping.letter = c1
a1.sources.r1.selector.mapping.number = c2
# Describe the sink
a1.sinks.k1.type = avro
a1.sinks.k1.hostname = hadoop103
a1.sinks.k1.port = 4141
a1.sinks.k2.type=avro
a1.sinks.k2.hostname = hadoop104
a1.sinks.k2.port = 4242
# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100
# Use a channel which buffers events in memory
a1.channels.c2.type = memory
a1.channels.c2.capacity = 1000
a1.channels.c2.transactionCapacity = 100
# Bind the source and sink to the channel
a1.sources.r1.channels = c1 c2
a1.sinks.k1.channel = c1
a1.sinks.k2.channel = c2

為 hadoop103 上的 Flume2 配置一個 avro source 和一個 logger sink。

a1.sources = r1
a1.sinks = k1
a1.channels = c1
a1.sources.r1.type = avro
a1.sources.r1.bind = hadoop103
a1.sources.r1.port = 4141
a1.sinks.k1.type = logger
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100
a1.sinks.k1.channel = c1
a1.sources.r1.channels = c1

為 hadoop104 上的 Flume3 配置一個 avro source 和一個 logger sink。

a1.sources = r1
a1.sinks = k1
a1.channels = c1
a1.sources.r1.type = avro
a1.sources.r1.bind = hadoop104
a1.sources.r1.port = 4242
a1.sinks.k1.type = logger

a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100
a1.sinks.k1.channel = c1
a1.sources.r1.channels = c1

4.分別在 hadoop102，hadoop103，hadoop104 上啟動 flume 程序，注意先後順序。 5.在 hadoop102 使用 netcat 向 localhost:44444 傳送字母和數字。 6.觀察 hadoop103 和 hadoop104 列印的日誌。

Flume基礎（十一）：自定義 Interceptor

Flume基礎（十一）：自定義 Interceptor

Kafka基礎（十一）：基本面試題（一）

Flink例項（二十一）：自定義時間和視窗的操作符（二）KeyedProcessFunction（二）

SpringCloud微服務實戰——搭建企業級開發框架（三十一）：自定義MybatisPlus程式碼生成器實現前後端程式碼自動生成

從零寫一個編譯器（十一）：程式碼生成之Java位元組碼基礎

Flink例項（五十五）：自定義時間和視窗的操作符（十）TimestampAssigner介面（一）設定事件時間

Flink例項（五十六）：自定義時間和視窗的操作符（十一）TimestampAssigner介面（二）生成水印的三個過載方法

Hbase基礎（十七）：億級資料從 MySQL 到 Hbase 的三種同步方案與實踐（一）環境搭建

《機器學習實戰》學習筆記（十一）：線性迴歸基礎篇之預測鮑魚年齡

資料結構與演演算法（十一）：圖的儲存與遍歷

Java 多執行緒基礎（十一）執行緒優先順序和守護執行緒

MYSQL 之 JDBC（十一）： JDBC獲取插入記錄的主鍵值

Scala 基礎（十四）：Scala 模式匹配（二）

Quartz.Net系列（十一）：System.Timers.Timer+WindowsService實現定時任務

ROS入門筆記（十一）：編寫與測試簡單的Service和Client (Python)

資料結構與演算法（十一）：二叉樹

設計模式學習筆記（十一）：組合模式

ROS中階筆記（十一）：ROS 2.0

Hbase基礎（十二）：Kylin視覺化

Flink基礎（十四）：Table API 和 Flink SQL（三）流處理中的特殊概念

Flume基礎（十一）：自定義 Interceptor

相關推薦