为了账号安全,请及时绑定邮箱和手机立即绑定

为Spark on Yarn配置WebUI日志记录

标签:
Spark

Spark on Yarn模式下在Spark Web UI上无法看到Spark应用程序执行的过程日志,这样在前期开发调试程序的时候很不方便.本文简单记录一下如何在Spark on Yarn模式下配置WebUI日志记录.

1.修改spark-defaults.conf

webp

    spark.eventLog.enabled设置true开启日志记录.

    spark.eventLog.dir存储日志路径,Application在运行过程中所有的信息均记录在该属性指定的路径下,我这里设置的是hdfs路径.(也可以是本地路径如file:///val/log/sparkEventLog).

    spark.yarn.historyServer.address设置History Server的地址和端口,这个链接将会链接到YARN检测界面上的Tracking UI.

    spark.history.fs.logDirectory日志目录和spark.eventLog.dir保持一致,Spark History Server页面只展示该指定路径下的信息.

    spark.eventLog.compress是否压缩记录Spark事件信息,前提spark.eventLog.enabled为true,默认使用的是snappy.

2.修改spark-env.sh

webp

spark.history.retainedApplications设置在History Server显示的Application历史记录个数,如果超过这个值,旧的应用程序信息将被删除.

3.在Yarn ResourceManager Web UI中的Tracking UI点击ApplicationMaster即可链接到Spark Web UI 日志信息页面

webp

webp



作者:囧蛋
链接:https://www.jianshu.com/p/4d28edc599ea


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消