-
map类型, {1,"Tom",<"Key",value>}
array类型,{1,"Tom",["Hello","World"]}
查看全部 -
## Hive 数据类型
基本数据类型:
- 整型:tinyint/smallint/int/bifint
- 浮点型:float/double
- 布尔型:boolean
- 字符串型:string/varchar/char
时间类型:
- Date:从 Hive 0.12 开始支持
- Timestamp:从 Hive 0.8 开始支持
复杂数据类型:
- Array:数组类型,由一系列具有相同数据类型的元素组成
- Map:集合类型,键值对(key/value)形式,可以通过key来访问元素
- Struct:结构类型,包含不同数据类型的元素,这些元素可以通过“点语法”访问元素。查看全部 -
hive启动远程服务--方便通过jdbc连接。
hive --service hiveserver &
查看全部 -
视图是虚表,可以简化复杂的查询
查看全部 -
创建桶表:
查看全部 -
桶表:
对数据进行哈希取值,然后放到不同文件中存储
查看全部 -
创建一个外部表,在创建的同时此表已经指向了存在的数据
查看全部 -
外部表
实际数据的存储与内部表有较大差异
查看全部 -
建立分区表可以提高查询的效率
查看全部 -
向分区表中插入数据
查看全部 -
基于性别的分区表
查看全部 -
分区表:
在hive中,表中的一个partition对应于表下的一个目录,所有的partition的数据都存储在对应的目录中
查看全部 -
内部表:
每个table在hive中都有一个相应的目录存储数据
所有的table数据都保存在这个目录中
删除表时,元数据与数据都会被删除
查看全部 -
Hive的体系结构:
hive的元数据
- Hive将元数据存储再数据库中,支持mysql,derby等数据库
- 元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等
查看全部 -
create view empinfo as select e.empno,e.ename,e.sal,e.sal*12 annlsal,d.dname from emp e,dept d where e.deptno=d.deptno;
视图(View) -视图是一种虚表,是一个逻辑概念;可以跨越多张表 -视图建立在已有基础上,视图赖以建立的这些表称为基表 -视图可以简化复杂的查询 视图表创建----案例
查看全部
举报