首页手记 Spark2.1.1 Yarn...

Spark2.1.1 Yarn ShuffleService在NodeManager升级问题分析

标签：

Spark

一、问题

首先，团队里不同的小组使用同一套hadoop集群，有做sqoop任务的，有做flink的，也有跑spark的。最近spark迁移2.1.1，升级shuffle-service，所以编译完社区2.1.1版本之后，就更新了nodemanager下的shuffle-service依赖，对于spark任务没有任何问题；

但问题却出在，其他小组在使用hadoop集群时，原本是运行的好好的，在升级完shuffle-service之后报scala冲突，具体如下：

23-06-2017 20:42:37 CST kafka_import_hotfix INFO - Error: scala.Predef$.augmentString(Ljava/lang/String;)Lscala/collection/immutable/StringOps;23-06-2017 20:42:38 CST kafka_import_hotfix INFO - Error: scala.Predef$.augmentString(Ljava/lang/String;)Lscala/collection/immutable/StringOps;23-06-2017 20:42:38 CST kafka_import_hotfix INFO - Container killed by the ApplicationMaster.23-06-2017 20:42:38 CST kafka_import_hotfix INFO - Container killed on request. Exit code is 14323-06-2017 20:42:38 CST kafka_import_hotfix INFO - Container exited with a non-zero exit code 143

二、分析

小组同学百思不得其解，最终还是定位到本次spark shuffle-service升级。想不到一个小的版本迭代，竟然有这么大的区别；

原来，在spark2.1.1中，common/network-yarn项目中引入了scala-library的依赖，导致编译的jar包中包含了scala2.11.8的scala代码；
而小组同学引用的kafka0.8项目是基于scala2.8编译的，导致上述问题；

社区引入commit:

7197a7bc7061e2908b6430f494dba378378d5d02 [SPARK-18993][BUILD] Unable to build/compile Spark in IntelliJ due to missing Scala deps in spark-tags
https://github.com/apache/spark/pull/16418

现在已经有人提交jira修复了该问题：https://issues.apache.org/jira/browse/MAPREDUCE-1700

三、解决

小组同学升级kafka0.8的scala依赖为2.11.8。

四、后续

存在的疑问：

虽然在hadoop/share/hadoop/yarn/lib下更新了spark-shuffle-service jar包，但从YARN资源申请的原理层面，如何解释该jar包如果传到小组同学项目的classpath中的？
社区在network-yarn中引入scala-library依赖的根据是什么？这岂不是在hadoop集群上留了一个很大的坑？

作者：分裂四人组
链接：https://www.jianshu.com/p/0bc82d4f0ad5

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

三国纷争

JAVA开发工程师

手记
篇

粉丝

51

获赞与收藏

178

关注作者，订阅最新文章

相关文章推荐

深入浅出 Hadoop YARN

Spark Yarn-cluster与Yarn-client

Hadoop 之分布式资源管理框架YARN

Hadoop 学习系列（三）之 YARN 详细解析

让 Hadoop 称霸至今的框架 --Hadoop Yarn

阅读免费教程

后端通用面试教程

41个小节 30273 342

网络编程入门教程

20个小节 12461 235

Pandas 入门教程

25个小节 18362 330

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

Spark2.1.1 Yarn ShuffleService在NodeManager升级问题分析

一、问题

二、分析

三、解决

四、后续

相关文章推荐

阅读免费教程