-
HBase的高性能
查看全部 -
配置hdfs-site.xml
配置单节点方式 dfs.replication:1
不检查权限 dfs.permissions.enabled:false
查看全部 -
Hadoop配置
hadoop-env.sh
配置java环境变量
core-site.xml
配置hdfs访问地址,创建hadoop的namenode存放目录,
不配置又默认目录
查看全部 -
安装需求
JDK1.7以上
Hadoop-2.5.0以上
Zookepper-3.4.5
查看全部 -
与关系型数据库对比
区别于关系型数据库,hbase列是动态增加的,关系型数据库是需要提前定好列
数据会自动切分,关系型数据库需要人工干预
自带高并发读写,关系型数据库需要引入缓存一类的插件实现
缺点:不支持条件查询,不能进行复杂查询
查看全部 -
regionserver管理的region说明
region是regionserver管理区域的划分
regionserver会对region自动切分,也可以通过人工干预方式划分
查看全部 -
列簇的概念
一张表的类簇尽可能不超过5个,否则容易导致性能下降
每个列簇的列数没有限制
列只有插入数据后才存在,是动态增加的
列在列簇中是有序的
查看全部 -
列簇举例说明:
基于列,每条数据有一个rowkey,一个timestamp,多个列簇,列簇包括多行数据,具体参照下图
查看全部 -
列簇举例说明
根据不同的一组列创建列簇
查看全部 -
列簇概念
hbase是面向列的数据库,建表时不需要创建列,只需要创建列簇
列簇就是根据一组类型的列创建列簇
查看全部 -
zookeeper调度->hbase存储->hdfs
hbase有两个服务 Master和RegionServer
查看全部 -
中文官方文档:http://abloz.com/hbase/book.html
版本选择
官方版:
http://archive.apache.org/dist/hbase
CDH版:
http://archive.cloudera.com/cdh5/
后者是cloudera整合之后的版本,相对比较稳定
查看全部 -
Hbase 的高扩展性,底层依赖HDFS当存储空间不足时可以动态增加DataNode节点。
高可用 底层依赖HDFS 自动备份
高性能 写入性能:底层LSM数据结构和RowKey有序排列在架构上的独特设计。
region切分、主键索引和缓存机制使得Hbase在海量数据下具备一定随机读取性能,该性能针对TRowKey的查询能达到毫秒级别
查看全部 -
Hbase 是面向列的存储,支持独立检索。列式存储其数据在表中是按照列存储的可以动态增加列
查看全部 -
Hbase数据库的应用场景: 交通、金融、电商、移动等
Hbase分布式文件存储系统 行在亿级以上
查看全部
举报