-
数据存储的设计
查看全部 -
存储设计hbase
查看全部 -
hbase 表存储的结构
查看全部 -
存储模式
1、列存储模式:可压缩数据,数据维护成本低,适合分析型数据
2、行存储模式:数据维护成本高,适合事物型数据
行式存储压缩比列式效率低
查看全部 -
实现接口:
查看全部 -
ZooKeeper
1、HDFS
2、Master/backup Master
3、Client
查看全部 -
HBase的存储模式
1、行式存储:索引性能好
2、列式存储:压缩性能好
3、行式存储与列式存储的应用环境:
1)单列或多列或使用频率较高,事务或读取频率不高、数据量非常大,使用列式存储
2)行式存储实现解决关系型数据解决方案,表与表之间有很强的关联关系且数据量不大的话,使用行式存储。
查看全部 -
HBase的存储模式
1、行式存储:索引性能好
2、列式存储:压缩性能好
查看全部 -
行式存储与列式存储:
行式存储是经典的 RDBMS 的存储解决方案,有以下特性:
- 在底层的存储结构上,每行的数据都存储在一起
- 行式存储维护大量的索引,存储成本较高,但是对于随机读的效率非常高
- 强事务支持
- 适用场景:OLTP 应用
列式存储是 HBase 等 NoSQL 列式数据库的解决方案,有以下特性:
- 在底层的存储结构上,每列的数据都存储在一起
- 列式存储由于其稀疏性的特性,存储成本较低。
- 适用场景:OLAP 应用,事务要求不高且数据量大查看全部 -
列族其实就是多个列的组合,Hbase表中的每个列都是归属于某个列族,列族是表的Schema的一部分,但是列不是,所以我们创建表的时候需要指定列族而不需要指定列的名称,列名都是以列族名作为前缀的,访问控制和内存的使用统计都是基于列族进行的,这样设计的前提是,某个列族中的所有列是经常需要一起访问的,这样才会使得数据存取的效率是最优的。
通常他们会有相同的数据类型,这样当我们对同一个列族中的数据进行压缩的时候可以获取更好的压缩性能。所以所Hbase本质上是一个列族式存储。
查看全部 -
region特点:
负载均衡和分布式存储的最小单元(存储的最小单元hfile)
数量太多会导致运行下降,太少会降低可扩展性,降低并行能力(region的数量不能低于节点的数量)
拆分策略 下线-拆分-子信息加入meta元信息-region server-同步到master
查看全部 -
HBase Table的组成:
table = Rowkey + Family + Column + Timtstamp + Value
数据存储模式:
(Table,RowKey,Family,Column,Timestamp )->value
查看全部 -
压缩方式对比
查看全部 -
测试查看全部
-
压缩属性详解
查看全部
举报