为了账号安全,请及时绑定邮箱和手机立即绑定

Hbase存储模式

Hbase本身是数据库,本身就是为了存储数据,因此了解其存储原理对我们是很有必要的,这样我们才能更好的使用Hbase。

首先才能存储模式开始,Hbase的存储模式与传统型的存储模式有什么区别。

行式存储与列式存储

列式存储(Columnar or column-based)是相对于传统关系型数据库的行式存储(Row-basedstorage)来说的。简单来说两者的区别就是如何组织表

  • 行式存储以一系列的行来存储一个表,一行一行的进行存储
  • 列式存储以一系列的列来存储一个表, 一个列一个列的进行存储

行式存储与列式存储的应用环境

如果需要关系查询,那么行式存储很好
行式存储最大的优点是关系之间的解决方案,表与表之间很大的关联关系并且数据量不大,那么行式存储就是很好的选择。记住因为它的线性扩展性不高,需要保证数据量不能特别大,控制在千万级与以下。

如果数据量非常大,使用列式存储
在大数据,利于压缩和扩展的肯定要选择列式存储,如果事务使用率不高,那么也最好使用列式存储,随机更新更些行的频率不高,也可以使用列式存储

Hbase的列族式存储

列族就是多个数据列的组合,列族式可以说是表的schema的一部分,而列不是。Hbase可以说是列簇数据库,在创建表的时候要指定列族,而不需要指定具体的列。

Hbase Table组成:
Table = rowkey + family + column + timestamp + value

数据存储模式:
(Table, rowkey , family , column , timestamp) -> Value

Hbase列数据默认可以保存3个版本,不过可以设置该属于保存几个版本。

Hbase数据存储原型

HBase 是一个稀疏的、分布式、持久、多维、排序的映射,它以行键(row key),列键(column key)和时间戳(timestamp)为索引。

Hbase在存储数据的时候,有两个SortedMap,首先按照rowkey进行字典排序,然后再对Column进行字典排序。

这张图可以看到其存储排序是先由rowkey排序,然后按列的名称进行排序

最后

Hbase作为NoSQL数据库和传统型数据库有相似的地方,但也有很大的差别,Hbase更多的是为了扩展性和性能考虑,弱化了事务,一起带着全新的思维来学习Hbase吧

参考

点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
JAVA开发工程师
手记
粉丝
1.1万
获赞与收藏
1544

关注作者,订阅最新文章

阅读免费教程

  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消