为了账号安全,请及时绑定邮箱和手机立即绑定

好程序员大数据入门学习之Hadoop技术优缺点

标签:
大数据 Hadoop

  大数据入门学习之Hadoop技术优缺点

  (1)Hadoop具有按位存储和处理数据能力的高可靠性。

  (2)Hadoop通过可用的计算机集群分配数据,完成存储和计算任务,这些集群可以方便地扩展到数以千计的节点中,具有高扩展性。

  (3)Hadoop能够在节点之间进行动态地移动数据,并保证各个节点的动态平衡,处理速度非常快,具有高效性。

  (4)Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配,具有高容错性。

 

  Hadoop的缺点

  (1)Hadoop不适用于低延迟数据访问。

  (2)Hadoop不能高效存储大量小文件。

  (3)Hadoop不支持多用户写入并任意修改文件。

 

  Hadoop的核心组件

  Hadoop自诞生以来,主要出现了Hadoop1、Hadoop2、Hadoop3三个系列多个版本。

  HDFS和MapReduce是Hadoop1的核心组件,Hadoop生态圈里的很多组件都是基于HDFS和MapReduce发展出来的。在继Hadoop1之后出现了Hadoop2,Hadoop2在Hadoop1的基础上做了改进。相比Hadoop1,Hadoop2的三大核心组件分别是HDFS、MapReduce、Yarn。目前市面上绝大部分企业使用的是Hadoop2,本书使用的是Hadoop2.7.3这一版本。

 

  Hadoop2的一个公共模块和三大核心组件组成了四个模块,简介如下。

  (1)HadoopCommon:为其他Hadoop模块提供基础设施。

  (2)HDFS:具有高可靠性、高吞吐量的分布式文件系统。

  (3)MapReduce:基于Yarn系统,分布式离线并行计算框架。

  (4)Yarn:负责作业调度与集群资源管理的框架。



点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消