为了账号安全,请及时绑定邮箱和手机立即绑定

史上最快! 10小时大数据入门实战(四)-分布式资源调度YARN

标签:
大数据

5bcf22e00001abaf10000309.jpg

1 YARN 产生背景

5bcf22e100016b1810000088.jpg


5bcf22e10001f55310000407.jpg


5bcf22e2000118ee10000161.jpg


5bcf22e30001e75610000390.jpg


5bcf22e5000193bb10000424.jpg


5bcf22e50001534c10000165.jpg

2  YARN 架构

5bcf22e70001771610000292.jpg


5bcf22e70001955b10000490.jpg


5bcf22e80001685e10000232.jpg

3 YARN 执行流程

629


1000


1.client向yarn提交job,首先找ResourceManager分配资源,
2.ResourceManager开启一个Container,在Container中运行一个Application manager
3.Application manager找一台nodemanager启动Application master,计算任务所需的计算
4.Application master向Application manager(Yarn)申请运行任务所需的资源
5.Resource scheduler将资源封装发给Application master
6.Application master将获取到的资源分配给各个nodemanager
7.各个nodemanager得到任务和资源开始执行map task
8.map task执行结束后,开始执行reduce task
9.map task和 reduce task将执行结果反馈给Application master
10.Application master将任务执行的结果反馈pplication manager。

4 YARN 环境搭建

5 提交 PI 的 MapReduce 作业到 TARN 上执行

1000

 



作者:芥末无疆sss
链接:https://www.jianshu.com/p/f59165b9c049
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消