Spark on Yarn-cluster 和 Yarn-client 区别
-
Yarn-cluster
和Yarn-client
区别
SparkContext
初始化不同,这也导致了Driver
所在的位置不同,Yarn-cluster
的Driver
是在集群的某一台NodeManager
上,但是Yarn-client
是在Driver
所在的机器上Driver
会和Executors
进行通信,这也导致了Yarn-cluster
在提交app之后可以关闭客户端,而Yarn-client
不可以Yarn-cluster
适合用于生产环境,Yarn-client
适合交互调试
⚠️ spark-shell/spark-sql
只支持 Yarn-client
模式,spark-submit
支持两种模式
- Spark on Yarn-client 架构图
- Spark on Yarn-cluster 架构图