为了账号安全,请及时绑定邮箱和手机立即绑定

HBase入门

卡弗卡大数据 数据科学家
难度初级
时长 2小时13分
学习人数
综合评分9.57
58人评价 查看评价
9.9 内容实用
9.3 简洁易懂
9.5 逻辑清晰
  • HBase表结构是面向列簇的,创建的时候需要指定数量,而无需指定各个列簇有哪些属性

    查看全部
  • regionserver以“集群”方式存在,需要实时告知master自己的状态信息

    查看全部
    0 采集 收起 来源:Hbase架构体系

    2019-12-05

  • HBase有着和HDFS相类似的节点部署(内部服务:master+regionserver)。HBase外部服务:ZooKeeper(分布式协调)+HDFS

    查看全部
    0 采集 收起 来源:Hbase架构体系

    2019-12-05

  • HBase采用列式存储,支持独立检索。HBase每一列都存储有多个版本。空的列并不占用存储空间。基于HDFS,高扩展性,高可靠性(多个副本)。高性能(写入&读取)。

    查看全部
    0 采集 收起 来源:Hbase的特点

    2019-12-05

  • HBase应用场景:交通/金融/电商/通讯

    查看全部
  • 应用场景及特点:海量数据存储,上百万行 x 上百亿列,准实时查询

    查看全部
    0 采集 收起 来源:Hbase能做什么

    2019-12-05

  • ①创建data/zkData数据目录

    需要手动创建一个类似于slave的从节点文件myid【固定的名字】里面存放就是server number

    在zookeeper-3.4.5-cdh5.10.0/下

    mkdir zkData

    cd zkData

    touch myid

    vi myid

    1

    上面第一台机器的number设为1


    ②分不到其他机器

    同时将配置分发到另外2台集群环境上。

    scp -r zookeeper-3.4.5-cdh5.10.0/ bigdata-pro02.kfk.com:/opt/modules/

    *bigdata-pro02.kfk.com为第二台机器的主机名

    scp -r zookeeper-3.4.5-cdh5.10.0/ bigdata-pro03.kfk.com:/opt/modules/

    同时别忘了修改另外两台机器myid文件,分别改为2,3

    ③启动服务bin/zkServer.sh start

    三台分别执行

    cd zookeeper-3.4.5-cdh5.10.0/

    bin/zkServer.sh start

    查看全部
  • 老师的环境。1台装Hadoop、Hbase,另外3台装的zookeeper集群。


    改变默认存放zookeeper的目录,希望存放在zookeeper工程目录下。

    conf/zoo.cfg中在修改配置

    dataDir-/opt/modules/zookeeper-3.4.5-cdh5.10.0/zkData

    另外还需要把三台集群的地址配置进来

    server.1=主机名

    查看全部
  • 启动 /opt/modules/hadoop-2.5.0/下启动服务

    ①cd /opt/modules/hadoop-2.5.0/

    ②启动前需要format,命令如下:

    bin/hdfs namenode -format

    运行后能看到之前配置/data/tmp路径下多了些文件,用于存放元素信息

    ③启动nameode

    sbin/hadoop-daemon.sh start namenode

    ④启动datanode

    sbin/hadoop-daemon.sh start datanode

    ⑤域名访问

    域名:50070

    查看全部
  • slaves 用于配置节点机器的位置。填入相同的主机名即可。

    查看全部
  • hdfs-site.xml 

    在里面配置副本数。

    设置为1代表是只有一个单节点。

    permission设置为false代表不让检查权限。默认为true


    查看全部
  • 命令hostname :查询主机名字

    配置core-site.xml 用于配置连接hdfs的路径

    还需要配置一个tmp dir的路径。这个存在路径是自行创建的,改变了默认的hadoop.tmp.dir的路径。放在etc同级目录下的 mkdir -p data/tmp

    * mkdir -p 创建子文件夹


    查看全部
  • 需要配置的文件:

    ①core-site.xml

    ②hadoop-env.sh

    ③hdfs-site.xml

    ④slaves

    查看全部
  • 需要配置的文件的路径 etc/hadoop路径下

    查看全部
  • HBase

    分布式数据库

    应用场景和特点

    ①海量数据存储,上百亿行*上百万列

    *一般关系数据库列不超过30列【百万行以内的就可以直接使用关系型数据库,没必要使用Hbase】

    ②准实时查询

    百毫秒内查询


    查看全部
    0 采集 收起 来源:Hbase能做什么

    2019-11-18

举报

0/150
提交
取消
课程须知
Hbase是现企业应用中非常流行的分布式数据库,不管是传统软件企业还是互联网企业,基本上HBase作为海量数据存储的首选。本课程由浅入深,从基础概念到安装部署、再到理论实战,一步一步引导式的全流程讲解,课程所设计的其他知识点也都包含其中。
老师告诉你能学到什么?
从基础概念到实战操作,目标是让零基础的学习者或者是菜鸟级的初学者都能够快速的入门。

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!