如何判断我的星火工作是否正在进行?
问题描述:
我有一个在YARN
上运行的spark工作,它似乎只是挂起而没有做任何计算。如何判断我的星火工作是否正在进行?
这里是纱说,当我做yarn application -status <APPLICATIOM ID>
:
Application Report :
Application-Id : applicationID
Application-Name : test app
Application-Type : SPARK
User : ec2-user
Queue : default
Start-Time : 1491005660004
Finish-Time : 0
Progress : 10%
State : RUNNING
Final-State : UNDEFINED
Tracking-URL : http://<ip>:4040
RPC Port : 0
AM Host : <host ip>
Aggregate Resource Allocation : 36343926 MB-seconds, 9818 vcore-seconds
Log Aggregation Status : NOT_START
Diagnostics :
而且,当我检查yarn application -list
它说,它是RUNNING
。但我不确定我是否相信这一点。当我去火花WebUI中,我看到的只是一个阶段,整个几个小时我一直在运行它:
此外,当我点击“阶段”选项卡上,我什么也看不见运行:
如何确保我的应用程序实际上是运行和YARN
是不是在骗我?
我实际上更喜欢这样抛出一个错误,而不是让我等待,看看这个工作是否有效运行。我怎么做?
答
如果您转到Spark UI并搜索“执行程序”选项卡。在那里你会得到你的工作正在运行的列表执行者和旁边的执行者ID和地址,你将有“日志”栏,你将有“标准输出”&“标准错误”选项卡。点击标准输出,你可以看到当你的作业运行时,这些日志是写在你的容器上的。
答
YARN
说它正在运行,因为应用程序没有退出或被杀死。 它不知道它是否卡住。在你的情况下,你可以在纱线客户端模式下运行Spark
作业,并查看应该建议它是否真的在运行的日志。
嗯。我没有看到。这是否意味着它没有进步? – Candic3
我们可以把这个聊一下吗? – Candic3
http://chat.stackoverflow.com/rooms/139996/spark-job-progress – Candic3