【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps


本讲义出自Marius van Niekerk在Spark Summit East 2017上的演讲,主要介绍了Toree的设计思想,Toree如何与Jupyter生态系统交互,以及用户如何借助强大的插件系统来扩展Apache Toree的功能。


目前许多数据科学家已经在利用Jupyter生态系统并进行数据分析,正在孵化中的Apache Toree是设计用于作为Spark网关,Apache Toree能让用户遵守Jupyter标准,这将允许用户非常简单地将Spark集成到已有的Jupyter生态系统中,并将允许用户轻松地语言和语境之间进行切换,而不需要切换到不同的工具集。


【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核

【Spark Summit East 2017】Apache Toree:Spark的一种Jupyter内核