Hadoop summit 2015 实时计算

有幸参加了6月9号到6月11号在圣何塞举办Hadoop summit 2015,主要关注了实时计算相关的topic。
本次参会的主要感受是:实时处理成为各个公司的标配,OLAP是基本需求。
下面我主要分享如下三个议题:

  • 实时计算框架(主要是storm,spark主题太少,涉及实时计算的基本没有)
  • RealTime Process和 Batch Process的统一
  • RealTime 处理架构以及Design Pattern

实时计算框架

这次Hadoop 峰会有一个storm的committer(来自yahoo)分享了storm在yahoo遇到的问题以及如何解决这些问题的方法,同时介绍了后续storm后续发展规划

Yahoo中最大的Topology

Hadoop summit 2015 实时计算

Yahoo中storm集群的规模

Hadoop summit 2015 实时计算
Hadoop summit 2015 实时计算
Hadoop summit 2015 实时计算

Yahoo中Hadoop集群和Storm集群的对比

Hadoop summit 2015 实时计算

Zk是storm集群规模扩张的绊脚石之一

Hadoop summit 2015 实时计算

heartbeat server

Hadoop summit 2015 实时计算
Hadoop summit 2015 实时计算

数据状态的收集以及Nimbus的jar down也是影响storm集群规模的因素

Hadoop summit 2015 实时计算

Storm需要基于资源和网络拓扑的调度

Hadoop summit 2015 实时计算

由于这次是hadoop summit 所以介绍spark很少,介绍spark streaming就没有了

RealTime Process和 Batch Process的统一

Hadoop summit 2015 实时计算

Batch Process

Hadoop summit 2015 实时计算
Hadoop summit 2015 实时计算

Stream Process

Hadoop summit 2015 实时计算
Hadoop summit 2015 实时计算

Streaming And Batch

Hadoop summit 2015 实时计算
Hadoop summit 2015 实时计算

Hadoop summit 2015 实时计算

Streaming only Pattern

Hadoop summit 2015 实时计算
Hadoop summit 2015 实时计算

SummingBird 统一batch和stream

Hadoop summit 2015 实时计算

RealTime 处理架构以及Design Pattern

一般情业务架构

Hadoop summit 2015 实时计算
Hadoop summit 2015 实时计算

Lambda Architecture And Kappa Architecture

Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算

Design Patterm

Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算

External Lookup

Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算

Responsive Shuffling

Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算

Out-of_sequence Events

Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算Hadoop summit 2015 实时计算

总结Hadoop summit 2015 实时计算

 该文章来自于阿里巴巴技术协会(ATA