首页手记 Hbase原理与架构

Hbase原理与架构

标签：

Hbase

我们都知道Hbase是一个构建在HDFS上的分布式列存储系统。Hbase主要用于海量数据的结构化存储。

Hbase是构建在HDFS上，可以使用MapReduce直接操作，或者使用直接使用。

HDFS的问题,HDFS只支持批处理的场景，不支持数据的随机查找，不适合增量数据查找，不支持数据更新。

Hbase特点

一个表可以承装上百万列
每一行的列可以动态的添加，不同行可以有不同的列
面向列族的存储和权限控制，数据即索引
对于空的列，不占用存储空间，表可以设计的非常稀疏
Hbase中都是字符串，每个单元格可以插入多个数据版本。

Hbase逻辑视图

Hbase的所有的操作都是基于rowkey的
支持put,get,scan多行操作支持，scan,multiput

Hbase物理模型

每一个列族存储在HDFS上的一个单独文件上，Hfile中。

Hbase中的数据结构

Hbase实际上是维护了一个多级索引：

<key,column family,column name,timestamp>

Table 中所有行都是按照rowkey进行字典排序，同时在行的方向上分为多个Region

Region按大小进行分割，每一个表开始只有一个Region,随着数据的增多，Region不断增大，当增大到一个阈值时，Region就会分割为两个Region,以及更多Region.

同时Region是Hbase中分布式存储的最小单位，不同的Region分布到不同的RegionServer上。

Hbase 存储

Region是分布式存储的最小单元，但不是存储的最小单元。Region由多个Store组成，每一个Store保存一个列族。

每一个Store又包括memStore和StoreFile组成。

Hbase架构

Client

包含访问HBase的接口，并维护cache来加快对HBase的访问。

zookeeper

保证任何时候，集群中只有一个master 存贮所有Region的寻址入口,实时监控Region server的上线和下线信息。并实时通知给Master ,存储HBase的schema和table元数据。

Master

为Region server分配region ,负责Region server的负载均衡,发现失效的Region server并重新分配其上的region ,管理用户对table的增删改查操作。

Region Server

Region server维护region，处理对这些region的IO请求 Region server负责切分在运行过程中变得过大的region

WAL

write-ahead-log,预先写日志，指的是在写数据的时候，先写Log这样当写Region失败后可以进行找回。

Master容错：Zookeeper重新选择一个新的Master 无Master过程中，数据读取仍照常进行；无master过程中，region切分、负载均衡等无法进行；

RegionServer容错：定时向Zookeeper汇报心跳，如果一旦时间内未出现心跳 Master将该RegionServer上的Region重新分配到其他RegionServer上；

失效服务器上“预写”日志由主服务器进行分割并派送给新的 RegionServer

Zookeeper容错：Zookeeper是一个可靠地服务一般配置3或5个Zookeeper实例。

作者：张晓天a
链接：https://www.jianshu.com/p/ee2ee31848fa

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

慕码人8056858

手记
篇

粉丝

351

获赞与收藏

1326

关注作者，订阅最新文章

阅读免费教程

后端通用面试教程

41个小节 32888 371

网络编程入门教程

20个小节 13641 256

Pandas 入门教程

25个小节 20282 387

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空