【Spark Summit East 2017】使用Alluxio提升Spark效率

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps


本讲义出自Gene Pang与Haoyuan  Li在Spark Summit East 2017上的演讲,主要介绍了Alluxio,前身为Tachyon,是内存加速虚拟分布式存储系统,该系统可以利用内存存储数据,并且加速访问从不同的数据存储系统的数据。Alluxio拥有迅速成长的开源社区,并且已经被部署在阿里巴巴、百度以及Intel等,Alluxio可以提高Spark的效率,并为Spark与各中存储系统之间搭建桥梁,进一步对于数据密集型应用程序进行加速。


【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率
【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率

【Spark Summit East 2017】使用Alluxio提升Spark效率