TA贡献1900条经验 获得超5个赞
这个要根据自己处理数据的方式来选择。1、Hive是支持SQL语句的,执行会调用mapreduce,所以延迟比较高;2、HBase是面向列的分布式数据库,使用集群环境的内存做处理,效率会比hive要高,但是不支持sql语句。Hadoop开发和运行处理大规模数据,需要用hbase做数据库,但由于hbase没有类sql查询方式,所以操作和计算数据非常不方便,于是整合hive,让hive支撑在hbase数据库层面的 hql查询,hive也即做数据仓库。
举报