走近大数据之Hive入门_学习笔记

首页免费课走近大数据之Hive入门笔记

走近大数据之Hive入门

                
                赵强老师
            数据库工程师

                    查看讲师更多课程 
                    赵强老师讲师的其他课程
                
Oracle高级查询
初级·63045
免费课程
                                
Oracle触发器
初级·36971
免费课程
                                
Oracle存储过程和自定义函数
初级·56419
免费课程
                                
Oracle数据库开发必备利器之PL/SQL基础
初级·75233
免费课程
                                
                难度初级
            
                时长 2小时21分
            
                学习人数
            
综合评分9.83
                            98人评价
                        查看评价
                                10.0
                                内容实用
                            
                                9.8
                                简洁易懂
                            
                                9.7
                                逻辑清晰

最热最新

Alphabc 00:15

hive安装

查看全部

0 采集收起来源：Hive安装之远程模式和本地模式
2018-05-28
慕粉2206434494 03:42
分区表（Partition）
- Partition 对应于数据库的Partition列的密集索引
- 在Hive中，表中的一个Partition对应于表下的一个目录，所有的Partition的数据都存储在对应的目录中
创建分区表
create table partition_table
(sid int,sname string)
partitioned by (gender string)
row format dellimited fields terminated by ',';
explain select * from partition_table
查看全部

0 采集收起来源：Hive的数据模型之分区表
2018-05-22
慕粉2206434494
- 内部表（Table）
1. 与数据库中的Table 在概念上是类似的
2. 每一个Table在Hive中都有一个相应的目录存储数据
3. 所有的Table数据（不包括External Table）（以稳定的形式）都保存在这个目录中
4. 删除表时，元数据与数据都会被删除
5. 创建内部表
  create table t1
  （tid int, tname string, age int）
查看全部

0 采集收起来源：Hive的数据模型之内部表
2018-05-22
慕粉2206434494
Hive的数据存储
- 基于HDFS(Hadoop的数据仓库)
- 没有专门的数据存储格式
- 存储结构主要包括：数据库，文件，表，视图
- 可以直接加载文本文件（.TXT文件等）
- 创建表时，指定Hive数据的列分割符与行分隔符
- 表
1. table 内部表
2. Partiton 分区表
3. External Table 外部表
4. Bucket Table 桶表
- 视图
查看全部

1 采集收起来源：Hive的数据存储
2018-05-22
慕粉2206434494

时间类型：
Timestamps:一个与时区无关的，存储的形式是一个UNIX以来偏移量，也就是一个数字（长整型），
Dates:描述了一个特定的日期（年、月、日）以{YYYY-MM-DD} 的格式，不足两位以0补齐

查看全部

1 采集收起来源：Hive的数据类型之时间数据类型
2018-05-22
慕粉2206434494

复杂数据类型的应用：
数组：
create table student
(sid int,
sname string,
grade array<float>--几个成绩)
集合类型：
1、
create table student1
(sid int,
sname string,
grade map<string,float>--一个科目的成绩);
2、
create talbe student3
(sid int,
sname string,
grades array<map<string,float>>--所有科目的成绩)；
结构类型：
create table student4
(sid int,
info struct<name:string,age:int,sex:string>
结构有点相似与数组，但是数组中的值必须是相同数据类型的，而结构中的数据类型可以不同。

查看全部

0 采集收起来源：Hive的数据类型之复杂数据类型
2018-05-22
慕粉2206434494 00:29
HIVE 的数据类型
1. hive - 数据仓库 - 数据库
基本数据类型
1. tinyint/smallint/int/bigint:整数类型
2. float/double:浮点数类型
3. boolean:布尔类型
4. string：字符串类型
复制数据类型：
1. array：数组类型，有一系列相同数据类型的元素组成
2. Map:集合类型，包含可以key->value键值对，可以通过key 来访问元素
3. Struct : 结构类型，可以包含不同数据类型的元素。这些元素可以通过“点语法”的方式来得到所需要的元素
时间类型
1. Date：从HIVE0.12.0开始支持
2. Timestamp ：从HIve0.8.0 开始支持
查看全部

0 采集收起来源：Hive的数据类型之基本数据类型
2018-05-22
慕粉2206434494

hive的远程服务
远程服务启动方式：
端口号100000
启动方式：#hive --service HIV额server&
以JDBC 或ODBC的程序登录到hive中操作数据时，必须选用远程服务启动方式

查看全部

0 采集收起来源：Hive的管理之远程服务
2018-05-22
慕粉2206434494
1. 启动hive网页服务： hive --service hwi
查看全部

0 采集收起来源：Hive的管理之web界面方式
2018-05-22
慕粉2206434494
1. 进入hive命令行：hive -- service cli
2. 进入hive命令行2：hive
3. 退出hive命令：1、exit 2、quit
  常用的CLI命令
4. 清屏：Ctrl+L 或者！clear
5. 查看数据仓库中表：show tables;
6. 查看数据仓库z 内置的函数：show functions
7. -- : 注释部分
8. hive函数类似于oracle中的函数
9. 查看表结构：desc 表名
10. 查看HDFS上的文件：dfs -ls 目录
11. 执行操作系统的命令：！命令
12. pwd : 查看当前目录下文件
13. -ls: 查看目录下所有文件
14. 执行HQL语句：select *** from ***
15. 静默模式（不打印调试输出信息）：hive -S
16. hive -e ：不进入交互模式，直接执行语句
17. 执行SQL的脚本
查看全部

0 采集收起来源：Hive的管理之CLI方式
2018-05-22
慕的地522374

创建一个partition表
create table partition_tabel(sid int,sname string) partitioned by (gender string) row format delimited fields terminated by ',';
向partition表中添加数据
insert into table partition_table partition(gender='M') select sid,sname from sample_data where gender='M';
insert into table partition_table partition(gender='F') select sid,sname from sample_data where gender='F';

explain select * from partition_table where gender='M';用来查看详细的执行步骤的

查看全部

0 采集收起来源：Hive的数据模型之分区表
2018-05-18
慕的地522374 00:39

Hive的数据类型

查看全部

0 采集收起来源：Hive的数据类型之基本数据类型
2018-05-18
梦合九千

sample_data的创建
http://www.imooc.com/qadetail/253191

查看全部

0 采集收起来源：Hive的数据存储
2018-05-18
慕的地522374

OLTP和OLAP

查看全部

0 采集收起来源：数据仓库简介
2018-05-17
慕的地522374 05:16

数据仓库的结构和建立过程

查看全部

0 采集收起来源：数据仓库简介
2018-05-17

首页上一页 11 12 13 14 15 16 17 下一页尾页

0/150

提交

取消

该课程已下架

课程须知: 1、熟练掌握Hadoop的体系结构，尤其是HDFS 2、熟悉Java编程 3、了解Linux的基本操作

老师告诉你能学到什么？: 1、数据仓库简介 2、Hive是什么？ 3、Hive的体系结构 4、Hive的安装与管理 5、Hive的数据类型 6、Hive的数据模型

微信扫码，参与3人拼团

热搜

最近搜索清空

走近大数据之Hive入门