-
HBase表结构是面向列簇的,创建的时候需要指定数量,而无需指定各个列簇有哪些属性
查看全部 -
regionserver以“集群”方式存在,需要实时告知master自己的状态信息
查看全部 -
HBase有着和HDFS相类似的节点部署(内部服务:master+regionserver)。HBase外部服务:ZooKeeper(分布式协调)+HDFS
查看全部 -
HBase采用列式存储,支持独立检索。HBase每一列都存储有多个版本。空的列并不占用存储空间。基于HDFS,高扩展性,高可靠性(多个副本)。高性能(写入&读取)。
查看全部 -
HBase应用场景:交通/金融/电商/通讯
查看全部 -
应用场景及特点:海量数据存储,上百万行 x 上百亿列,准实时查询
查看全部 -
①创建data/zkData数据目录
需要手动创建一个类似于slave的从节点文件myid【固定的名字】里面存放就是server number
在zookeeper-3.4.5-cdh5.10.0/下
mkdir zkData
cd zkData
touch myid
vi myid
1
上面第一台机器的number设为1
②分不到其他机器
同时将配置分发到另外2台集群环境上。
scp -r zookeeper-3.4.5-cdh5.10.0/ bigdata-pro02.kfk.com:/opt/modules/
*bigdata-pro02.kfk.com为第二台机器的主机名
scp -r zookeeper-3.4.5-cdh5.10.0/ bigdata-pro03.kfk.com:/opt/modules/
同时别忘了修改另外两台机器myid文件,分别改为2,3
③启动服务bin/zkServer.sh start
三台分别执行
cd zookeeper-3.4.5-cdh5.10.0/
bin/zkServer.sh start
查看全部 -
老师的环境。1台装Hadoop、Hbase,另外3台装的zookeeper集群。
改变默认存放zookeeper的目录,希望存放在zookeeper工程目录下。
conf/zoo.cfg中在修改配置
dataDir-/opt/modules/zookeeper-3.4.5-cdh5.10.0/zkData
另外还需要把三台集群的地址配置进来
server.1=主机名
查看全部 -
启动 /opt/modules/hadoop-2.5.0/下启动服务
①cd /opt/modules/hadoop-2.5.0/
②启动前需要format,命令如下:
bin/hdfs namenode -format
运行后能看到之前配置/data/tmp路径下多了些文件,用于存放元素信息
③启动nameode
sbin/hadoop-daemon.sh start namenode
④启动datanode
sbin/hadoop-daemon.sh start datanode
⑤域名访问
域名:50070
查看全部 -
slaves 用于配置节点机器的位置。填入相同的主机名即可。
查看全部 -
hdfs-site.xml
在里面配置副本数。
设置为1代表是只有一个单节点。
permission设置为false代表不让检查权限。默认为true
查看全部 -
命令hostname :查询主机名字
配置core-site.xml 用于配置连接hdfs的路径
还需要配置一个tmp dir的路径。这个存在路径是自行创建的,改变了默认的hadoop.tmp.dir的路径。放在etc同级目录下的 mkdir -p data/tmp
* mkdir -p 创建子文件夹
查看全部 -
需要配置的文件:
①core-site.xml
②hadoop-env.sh
③hdfs-site.xml
④slaves
查看全部 -
需要配置的文件的路径 etc/hadoop路径下
查看全部 -
HBase
分布式数据库
应用场景和特点
①海量数据存储,上百亿行*上百万列
*一般关系数据库列不超过30列【百万行以内的就可以直接使用关系型数据库,没必要使用Hbase】
②准实时查询
百毫秒内查询
查看全部
举报