博客
关于我
大数据之Flume:Flume监控端口数据官方案例
阅读量:330 次
发布时间:2019-03-04

本文共 1066 字,大约阅读时间需要 3 分钟。

监控端口数据方案实例

案例需求

我们需要使用Flume监听一个指定端口,收集该端口的数据,并将其打印到控制台。

需求分析

为了实现上述需求,我们需要以下几个关键组件:

实现步骤

1. 使用的组件

(1)netcat source

作用:监听特定TCP端口收到的数据,将每行数据封装成一个事件。

(2)Logger sink

作用:使用日志输出器将事件输出到控制台或文件。

(3)Memory Channel

作用:用于缓冲事件数据,确保数据处理的高效性。

2. 安装必要工具

[sudo yum install -y nc]  # 安装netcat工具

3. 创建Flume Agent配置文件

mkdir -p flume/job  # 创建工作目录cd flume/job  # 进入工作目录vim flume-netcat-logger.conf  # 打开配置文件

4. 启动Flume Agent

bin/flume-ng agent -c conf/ -n a1 -f job/flume-netcat-logger.conf -Dflume.root.logger=INFO,console

5. 发送数据测试

nc localhost 44444 < "hello bigdata"

6. 监控数据接收情况

配置文件详解

# 配置文件内容a1.sources = r1a1.sinks = k1a1.channels = c1a1.sources.r1.type = netcata1.sources.r1.bind = localhosta1.sources.r1.port = 44444a1.sinks.k1.type = loggera1.channels.c1.type = memorya1.channels.c1.capacity = 1000a1.channels.c1.transactionCapacity = 100a1.sources.r1.channels = c1a1.sinks.k1.channel = c1

启动命令说明

  • -c:指定配置文件存储路径
  • -n:指定Flume Agent的名称
  • -f:指定要加载的配置文件路径
  • -Dflume.root.logger=INFO,console:设置日志打印级别为INFO,输出到控制台

测试发送数据

nc localhost 44444 < "hello bigdata"

监控数据接收

通过Flume的监控界面可以实时观察数据接收情况。

转载地址:http://xmoh.baihongyu.com/

你可能感兴趣的文章
Nuget~管理自己的包包
查看>>
NuGet学习笔记001---了解使用NuGet给net快速获取引用
查看>>
nullnullHuge Pages
查看>>
NullPointerException Cannot invoke setSkipOutputConversion(boolean) because functionToInvoke is null
查看>>
null可以转换成任意非基本类型(int/short/long/float/boolean/byte/double/char以外)
查看>>
Numix Core 开源项目教程
查看>>
numpy
查看>>
NumPy 或 Pandas:将数组类型保持为整数,同时具有 NaN 值
查看>>
numpy 或 scipy 有哪些可能的计算可以返回 NaN?
查看>>
numpy 数组 dtype 在 Windows 10 64 位机器中默认为 int32
查看>>
numpy 数组与矩阵的乘法理解
查看>>
NumPy 数组拼接方法-ChatGPT4o作答
查看>>
numpy 用法
查看>>
Numpy 科学计算库详解
查看>>
Numpy.fft.fft和numpy.fft.fftfreq有什么不同
查看>>
Numpy.ndarray对象不可调用
查看>>
Numpy:按多个条件过滤行?
查看>>
Numpy:条件总和
查看>>
numpy、cv2等操作图片基本操作
查看>>
numpy判断对应位置是否相等,all、any的使用
查看>>