-
hbase的特点
容量大:hbase单表可以有百亿行、百万列,数据矩阵横向和纵向两个纬度所支持的数据量级都非常具有弹性
面向列:hbase是面向列的存储和权限控制,并支持独立检索。列式存储,其数据在表中是按照某列存储的,这样在查询只需要少数几个字段的时候,能大大减少读取的数据量
多版本:hbase每一个列的数据存储有多个version
稀疏性:为空的列并不占用存储空间,表可以设计的非常稀疏
扩展性:底层依赖于hdfs
高可靠性:WAL机制保证了数据写入时不会因集群异常而导致写入数据丢失:Replication机制保证了在集群出现严重的问题时,数据不会发生丢失或损坏。而且hbase底层使用hdfs,hdfs本身也有备份
高性能:底层的LSM数据结构和Rowkey有序排序等架构上的独特设计,使得hbase具有非常高的写入性能。region切分、主键索引和缓存机制使得hbase在海量数据下具备一定的随机读取性能,该性能针对Rowkey的查询能够到达毫秒级别
查看全部 -
歇歇笔记查看全部
-
和关系数据库比较优劣
查看全部 -
设计模型
数据模型
查看全部 -
设计模型
表结构模型
查看全部 -
HBase架构体系
查看全部 -
Hbase的定位
查看全部 -
HBase的特点
1、容量大2、面向列3、多版本4、稀疏性5、扩展性6、高可靠性
7、高性能
底层的LSM数据结构和Rowkey有序排列等结构上的独特设计,使得HBase具有非常高的写入性能。region切分、主键索引和缓存机制使得HBase在海量数据下具备一定的随机读取性能。
查看全部 -
rowkey相当于表的行主键。timestamp是时间戳。Hbase是基于key-value形式的。所以在列簇内,每一列都有一个key和value。
列簇的注意事项:
1、一张表的列簇不会超过5个,超过5个会影响查询效率
2、每个列簇中的列数没有限制
3、列只有插入数据后才会存在,没插入数据不会占用磁盘空间
4、列在列簇中是有序的
对比关系行数据库:
1.列动态增加 2.数据自动切分 3. 高并发读写(关系型数据库则需要搭配缓存使用)4.不支持条件查询,仅支持rowkey匹配查询
查看全部 -
列簇不能超5个查看全部
-
hbase数据模型查看全部
-
hbase数据库表规模:百亿行*百万列查看全部
-
安装基本条件
查看全部 -
一个regionserver中有若干张表,一张表中列簇不能超过5个;每个列簇中列数没有限制。列只有插入数据后才会存在——动态增加。列在列簇中是有序的。
HBase特点总结:1.列动态增加 2.数据自动切分 3. 高并发读写(关系型数据库则需要搭配缓存使用)4.不支持条件查询,仅支持rowkey匹配查询
查看全部 -
HBase数据模型
RowKey相当于主键
查看全部
举报