Strata Data Conference Beijing教学辅导课 [多功能厅8A+8B议题介绍]
从简单到复杂:Apache Kafka应用实例详解
1. Apache Kafka简介
1.1 Kafka的基本概念(Topic,Partition,Offset)
1.2 Kafka的数据生命周期(Producer,Broker,Consumer)
1.3 Kafka的特性(high throughput,low latency,persistency,replication)
1.4 Kafka的功能接口
2. Kafka的应用实例
2.1 数据流水线
2.2 流处理(如果Kafka 0.11在演讲时已发布将会介绍transaction support)
2.3 数据库备份
2.4 CDC
3. Kafka的运维
3.1 如何判断一个Kafka Cluster是否健康(核心指标)
3.2 如何对Kafka Cluster进行性能分析
3.3 LinkedIn的Kafka运维工具
现代流计算架构
Twitter的所有应用都是实时的。由于对于实时性的高要求,Twitter在过去几年的时间内投入人力和研发了一整套实时数据技术栈。最近,越来越多的企业对于实时数据技术架构感兴趣。从批处理向流计算机构的转型,是企业关于如何使用数据的一次技术革命。但是,实时数据技术栈(包括流计算引擎、数据存储引擎、编程语言和工具)的最前沿现状又是什么呢?在这其中,又有哪些技术挑战?以及这些前沿技术怎么影响流计算的架构和应用呢?
本辅导课将会介绍:
- 流计算的简介,以及一些典型应用
- 流计算架构是什么?
- 不同类型的流计算架构和他们的优缺点
- 详细讨论为实时数据存储设计的Apache DistributedLog,以及它在现代实时数据技术栈里的使用场景
- 详细讨论流计算引擎Heron,以及它在现代实时数据技术栈里的使用场景
- Twitter在使用Apache DistributedLog和Heron来搭建实时数据技术栈时获得的经验教训。
Strata Data Conference北京站已经打开注册系统,阅读原文可浏览截止到目前为止的讲师名单和已经确认的议题,最优惠票价期截止到5月5日为止,尽快注册以确保留位。