## Hive 数据类型
基本数据类型:
- 整型:tinyint/smallint/int/bifint
- 浮点型:float/double
- 布尔型:boolean
- 字符串型:string/varchar/char
时间类型:
- Date:从 Hive 0.12 开始支持
- Timestamp:从 Hive 0.8 开始支持
复杂数据类型:
- Array:数组类型,由一系列具有相同数据类型的元素组成
- Map:集合类型,键值对(key/value)形式,可以通过key来访问元素
- Struct:结构类型,包含不同数据类型的元素,这些元素可以通过“点语法”访问元素。
基本数据类型:
- 整型:tinyint/smallint/int/bifint
- 浮点型:float/double
- 布尔型:boolean
- 字符串型:string/varchar/char
时间类型:
- Date:从 Hive 0.12 开始支持
- Timestamp:从 Hive 0.8 开始支持
复杂数据类型:
- Array:数组类型,由一系列具有相同数据类型的元素组成
- Map:集合类型,键值对(key/value)形式,可以通过key来访问元素
- Struct:结构类型,包含不同数据类型的元素,这些元素可以通过“点语法”访问元素。
2018-06-16
常见的 Hive CLI 命令:
清屏:Ctrl + L 或者 !clear;
查看数据仓库中的表:show tables;
查看数据仓库中的内置函数:show functions;
查看表结构:desc tb_name;或describe tb_name
查看 HDFS 上的文件:dfs -ls hdfs_dir;
执行Linux操作系统的命令:!命令;
执行SQL脚本:source SQL文件,与MySQL一样。
执行HQL语句:select * from tb_name;
清屏:Ctrl + L 或者 !clear;
查看数据仓库中的表:show tables;
查看数据仓库中的内置函数:show functions;
查看表结构:desc tb_name;或describe tb_name
查看 HDFS 上的文件:dfs -ls hdfs_dir;
执行Linux操作系统的命令:!命令;
执行SQL脚本:source SQL文件,与MySQL一样。
执行HQL语句:select * from tb_name;
2018-06-16
启动Hive报错,需要修改MySQL数据库权限,使其能够远程登录:
grant all privileges on hive.* to root@'%' identified by '123456';
若报以下错误:FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask...,则需要修改MySQL字符集:
alter database hive character set latin1;
grant all privileges on hive.* to root@'%' identified by '123456';
若报以下错误:FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask...,则需要修改MySQL字符集:
alter database hive character set latin1;
2018-06-16
Hive 有三种安装模式:
1. 嵌入模式:元数据信息存储在 Hive 自带的 Apache Derby 数据库中;只允许创建一个连接;多用于 demo。
2. 本地模式:与嵌入模式很类似,只是元数据信息存储在另外的数据库(通常是 MySQL)中;MySQL 数据库与 Hive 数据仓库运行在同一台物理机器上;多用于开发和测试。
3. 远程模式:与本地模式很类似,只是元数据信息存储在另外一台机器上的 MySQL 数据库中;允许创建多个连接;==推荐在生产环境中使用==。
1. 嵌入模式:元数据信息存储在 Hive 自带的 Apache Derby 数据库中;只允许创建一个连接;多用于 demo。
2. 本地模式:与嵌入模式很类似,只是元数据信息存储在另外的数据库(通常是 MySQL)中;MySQL 数据库与 Hive 数据仓库运行在同一台物理机器上;多用于开发和测试。
3. 远程模式:与本地模式很类似,只是元数据信息存储在另外一台机器上的 MySQL 数据库中;允许创建多个连接;==推荐在生产环境中使用==。
2018-06-16
Hive 中的元数据包括表名、列名、分区及其属性、表的属性(是否为外部表等)、表的数据所在的目录等。
Hive 将元数据存储在数据库(metastore)中,支持 Apache Derby、MySQL、Oracle 等数据库,元数据默认存储在 Apache Derby 中。
Hive 将元数据存储在数据库(metastore)中,支持 Apache Derby、MySQL、Oracle 等数据库,元数据默认存储在 Apache Derby 中。
2018-06-16
## OLTP 与 OLAP
当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing)。
- OLTP 是传统的关系型数据库的主要应用,主要是一些事务处理,例如银行交易,所以 OLTP 也被称为面向交易的处理系统,其基本特征是顾客的原始数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果。
- OLAP 是数据仓库系统的主要应用,专门设计用于支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing)。
- OLTP 是传统的关系型数据库的主要应用,主要是一些事务处理,例如银行交易,所以 OLTP 也被称为面向交易的处理系统,其基本特征是顾客的原始数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果。
- OLAP 是数据仓库系统的主要应用,专门设计用于支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
2018-06-16