Spark学习之路——5.Spark UI

一、Spark UI解读

Jobs页面可以看到所有Jobs的执行情况,job的数量取决于action算子的数量。

Stages页面列出所有Stage的执行情况。Spark stage切分是按照宽依赖来区分的,因此粒度上要比job更细一些。

Storage页面显示所做的cache persist等操作。

Environment页面里面展示了当前spark所依赖的环境,比如jdk,lib等等

Executors页面显示executor运行情况,这里可以看到执行者申请使用的内存以及shuffle中input和output的内存等数据。

二、分别用local/standalone/yarn模式运行workcount

1.通过Spark UI来查看执行进度:

①Local模式:

Spark学习之路——5.Spark UI

②standalone模式

Spark学习之路——5.Spark UI

Spark学习之路——5.Spark UI

③yarn模式

Spark学习之路——5.Spark UI

Spark学习之路——5.Spark UI

2.截取执行成功后输出的结果

①local模式

Spark学习之路——5.Spark UI

②standalone模式

Spark学习之路——5.Spark UI

③yarn-client模式

Spark学习之路——5.Spark UI