-
示例
CLI进入与退出命令
查看全部 -
CLI命令行方式
查看全部 -
Hive管理
查看全部 -
Hive体系结构
查看全部 -
HQL的解析和执行的过程
查看全部 -
数据仓库的结构和建立过程
查看全部 -
hive中的表包括,内部表――就是数据库中存储的表,创建方法,create table t1(field definition list) row delimited fields determined by ','; 外部表――就是一个表,其与hdfs文件建立链接,删除该表仅删除链接,数据不影响。 分区表――就是将一个表按某一字段进行分区,提高查询速度,创建方法,create table t2(field definition list) row delimited fields determined by ',' partitioned by(sex string); 桶表――将表中某一列进行哈希、分组,结果分成几个桶,将相同哈希的数据放在一个桶中。创建方法create table t3(field definition list) row delimited fields determined by ',' partitioned by (name string) into 5 buckets;查看全部
-
Hive表==>HDFS目录
Hive数据==>HDFS文件
查看全部 -
Hive概念
查看全部 -
什么是Hive
查看全部 -
数据仓库本质上就是一个数据库。 但是数据仓库还是有别于传统的数据库: 数据仓库是一个面向主题的(按照一定主题进行组织的),集成的(数据来自于分散的操作性的数据),不可更新的(主要数据查询),随时间不变化的数据集合,他用于支持企业或组织的决策分析处理。 OLTP:面向事物,操作频率高 OLAP:面向查询,基于历史数据,从而进行数据挖掘 星形模型 => 雪花模型
查看全部 -
Hive概念之一
HIVE是构建在Hadoop HDFS上的一个数据仓库查看全部 -
分区表 在数据量特别大的时候,可以根据一定的条件对数据进行分区,这样可以减少扫描的数量,降低查询速度 hive中,表中的partition对应表下的一个目录 可以使用执行计划语句,explain ...比较创建分区后的不同执行过程 create table partition_table(sid int ,sname string) partitioned by(gender string) row format delimited fields termimated by ','; insert into table partition_table partition(gender='M') select sid,sname from t1 where gender ='M'; insert into table partition_table partition(gender='F') select sid,sname from t1 where gender ='F'; 执行计划: explain select * from table查看全部
-
生产环境下的Hive查看全部
-
Web控制台 只能查询 需要通过源码打包手动添加查看全部
举报
0/150
提交
取消