【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps

本讲义出自Bas Geerdink在Spark Summit EU 2016上的演讲,主要介绍了什么是ETL,其实ETL就是对于数据的提取、转换、加载(Extract-Transform-Load),并介绍了ETL的一些常用工具,除此之外,Bas Geerdink着重介绍了为什么要用Spark来做ETL,并对于一些代码示例进行了分享。


【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!

【Spark Summit EU 2016】摆脱传统ETL,让我们走向Spark吧!