您的位置: 首页 > 文章 > Spark集群周边的Web UI设置与打开的条件(持续更新中)

Spark集群周边的Web UI设置与打开的条件(持续更新中)

分类: 文章 • 2024-11-16 20:39:34

下面是变量名:

变量	取值	所在文件	作用
spark.eventLog.enabled	true	spark-defaults.conf	开启日志记录
spark.eventLog.dir	file:///home/appleyuchi/bigdata/spark-2.3.1-bin-hadoop2.7/logs/applicationHistory	spark-defaults.conf	Application在运行过程中所有的信息均记录在该属性指定的路径下
spark.yarn.historyServer.address	Desktop:18080	spark-defaults.conf	设置History Server的地址和端口,这个链接将会链接到YARN检测界面上的Tracking UI.
spark.eventLog.compress	true	spark-defaults.conf
spark.history.fs.logDirectory	file:///home/appleyuchi/bigdata/spark-2.3.1-bin-hadoop2.7/logs/applicationHistory	spark-defaults.conf	日志目录和spark.eventLog.dir保持一致,Spark History Server页面只展示该指定路径下的信息.

spark-env.sh中可以设置:

export SPARK_HOME_OPTS="-Dspark.history.retainedapplicatons=15"

链接	相关组件	想打开该链接必须满足的条件
http://master:4040	Spark	启动spark-shell或者pyspark
http://master:8080	Spark-Master	$SPARK_HOME/sbin/start-all.sh
http://master:8088/	Hadoop-Yarn	$HADOOP_HOME/sbin/stop-all.sh
http://master:19888	Hadoop-History	$HADOOP_HOME/sbin/mr-jobhistory-daemon.sh start historyserver
http://master:18080	Spark-History	$SPARK_HOME/sbin/start-history-server.sh
http://master:50070	Hadoop	$HADOOP_HOME/sbin/stop-all.sh
http://master:10002	Hive	Hive2.2.0以后已经删除HWI界面[2]
http://master:60010	Hbase	还没有完成

注意:

上面的start-all里面不包含启动history服务器。

#------------------------------------------------------------实践操作---------------------------------------------------------------------------------

首先分别运行MapReduce实验和SPARK实验

Hadoop的Mapreduce和SPARK的RDD两种实验的history log在web UI上分别怎么看呢？

Spark集群周边的Web UI设置与打开的条件(持续更新中)

图中可以看到，最上面两行的Application Type分别是SPARK和MAPREDUCE.

如果点击SPARK右侧的History,会跳转到

Spark集群周边的Web UI设置与打开的条件(持续更新中)

如果点击MAPREDUCE右侧的History,会跳转到

Spark集群周边的Web UI设置与打开的条件(持续更新中)

结论:

Web UI会根据实验的类型(SPARK/MAPREDUCE)而跳转到不同的log页面

#------------------------------------------------------------实践操作---------------------------------------------------------------------------------

#-------------------------------------------------------------Spark和Hadoop服务器在jps中的名称----------------------------------------------------

组件	History服务器在jps中的名称
Spark	HistoryServer
Hadoop	JobHistoryServer

Reference:

[1]为Spark on Yarn配置WebUI日志记录

[2]Hive Web 接口(从 Hive 2.2.0 开始删除 component)