Flume Agent内部原理以及Flume拓扑结构

Flume Agent内部原理 

Flume Agent内部原理以及Flume拓扑结构

 Flume拓扑结构

一、Flume Agent连接

Flume Agent内部原理以及Flume拓扑结构

这种模式是将多个flume给顺序连接起来了,从最初的source开始到最终sink传送的目的存储系统。此模式不建议桥接过多的flume数量, flume数量过多不仅会影响传输速率,而且一旦传输过程中某个节点flume宕机,会影响整个传输系统。

二、单source,多channel、sink

Flume Agent内部原理以及Flume拓扑结构

Flume支持将事件流向一个或者多个目的地。这种模式将数据源复制到多个channel中,每个channel都有相同的数据,sink可以选择传送的不同的目的地。 

 

三、Flume负载均衡

Flume Agent内部原理以及Flume拓扑结构

Flume支持使用将多个sink逻辑上分到一个sink组,flume将数据发送到不同的sink,主要解决负载均衡和故障转移问题。

 

四、Flume Agent聚合

Flume Agent内部原理以及Flume拓扑结构

这种模式是我们最常见的,也非常实用,日常web应用通常分布在上百个服务器,大者甚至上千个、上万个服务器。产生的日志,处理起来也非常麻烦。用flume的这种组合方式能很好的解决这一问题,每台服务器部署一个flume采集日志,传送到一个集中收集日志的flume,再由此flume上传到hdfs、hive、hbase、jms等,进行日志分析。