大数据的数据模型

讲师:Ted Malaska (Blizzard Entertainment )

09:00–12:30 周四, 2017-07-13

数据工程和架构, 英文讲话 (Presented in English)

地点: 多功能厅5B+C

观众水平:Beginner


必要预备知识

Basic SQL


您将学到什么

Basic understand of relational data models


描述

从Spark到Impala,再到Spark Streaming或Storm,分布式计算引擎最近的发展令人兴奋。然而,如果你的设计仅仅只是专注于数据处理层并期望得到高速度和性能,那么你可能就忽视了故事的另外一半,从而没能用到很多的优化方法。

Ted Malaska关注于技术栈的下层,将会介绍一系列在Cassandra、HBase、Kudu、Kafka、SoIR、Elasticsearch、HDFS和S3上实现的存储设计的模式和规划。通过仔细地调整每种业务场景下数据存储的方式,数据处理和访问的时间可以降低两到三个数量级。

你在本课程里学习到的策略和原理可以被应用于很多的软件环境。课程里会展示使用HDFS、HBase、Cassandra、Kudu、Kafka、Elasticsearch和S3的例子。


讲师介绍

Ted Malaska (Blizzard Entertainment)

Ted Malaska is a group technical architect on the Battle.net team at Blizzard, helping support great titles like World of Warcraft, Overwatch, and HearthStone. Previously, Ted was a principal solutions architect at Cloudera helping clients find success with the Hadoop ecosystem and a lead architect at the Financial Industry Regulatory Authority (FINRA). He has also contributed code to Apache Flume, Apache Avro, Apache Yarn, Apache HDFS, Apache Spark, Apache Sqoop, and many more. Ted is a coauthor of Hadoop Application Architectures, a frequent speaker at many conferences, and a frequent blogger on data architectures.




Strata Data Conference北京站已经打开注册系统,阅读原文可浏览截止到目前为止的讲师名单和已经确认的议题,最优惠票价期截止到5月5日为止尽快注册以确保留位

大数据的数据模型