【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps


本讲义出自Lucy Lu与Eric Kaczmarek在Spark Summit East 2017上的演讲,主要介绍了正在研发中的基于Spark的编程平台GATK4(Genome Analysis Toolkit version 4 ),并用案例讲解了如何在云上配置Spark集群加速对于基因序列的测序工作。除此之外还介绍了名为PAT的内部数据分析框架,并介绍了如何使用PAT快速建立Spark与虚拟机合适的配置组合来优化对于云的硬件资源以及Spark计算并行性的使用。


【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究

【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究