走近大数据之Hive进阶_技术问答

首页免费课走近大数据之Hive进阶问答

走近大数据之Hive进阶

                
                赵强老师
            数据库工程师

                    查看讲师更多课程 
                    赵强老师讲师的其他课程
                
Oracle高级查询
初级·62898
免费课程
                                
Oracle触发器
初级·36901
免费课程
                                
Oracle存储过程和自定义函数
初级·56328
免费课程
                                
Oracle数据库开发必备利器之PL/SQL基础
初级·75086
免费课程
                                
                难度初级
            
                时长 2小时15分
            
                学习人数
            
综合评分9.73
                            56人评价
                        查看评价
                                9.8
                                内容实用
                            
                                9.9
                                简洁易懂
                            
                                9.5
                                逻辑清晰

全部评论问答未解决精华

慕移动2425727

等值连接，不等值连接那里讲的好乱，不够清晰，不理解left join 和right join的人听会听晕的

0 5-2 Hive外连接

2018-06-20

白小明

感谢老师分享，期待更优质资源！

1 9-1 课程总结

2018-06-17

白小明

等值连接（连接条件是等号）:

```
select e.empno, e.ename, e.sal, d.dname
from emp e,dept d
where e.deptno=d.deptno;
```

不等值连接（连接条件不是等号）：

```
select e.empno, e.ename, e.sal, d.dname
from emp e,dept d
where e.deptno between 1 and 10;
```

0 5-1 Hive等值连接和不等值连接

2018-06-17

白小明

to_date('2018-6-17')：取出一个字符串中的年月日部分
year('2018-6-17')：取出一个字符串中的年
month('2018-6-17')：取出一个字符串中的月
day('2018-6-17')：取出一个字符串中的日
weekofyear('2018-6-17')：本周是一年中的第几周
datediff('2018-6-17', '2019-6-17')：两个日期相差的天数
date_add('2018-6-17', 2)：在一个日期上加上多少天
date_sub('2018-6-17', 2)：在一个日期上减去多少天

1 4-4 Hive日期函数

2018-06-17

白小明

数学函数：
round(number, n)：对number进行四舍五入操作，并保留n位小数
ceil(number)：向上取整
floor(number)：向下取整

字符函数：
lower(str)：把字符串转为小写
upper(str)：把字符串转为大写
length(str)：字符串的长度
concat(str1, str2)：字符串拼接
substr(str, start[, length])：截取子串
trim(str)：去掉字符串收尾的空格
lpad(str, length, mark)：左填充
rpad(str, length, mark)：右填充

0 4-2 Hive字符函数

2018-06-17

白小明

'%\\_%'

0 3-2 Hive进阶-在查询中使用过滤

2018-06-17

白小明

在 Hive 中，大部分 HQL 查询语句都会被转换为 MapReduce 作业进行执行，但也有小部分查询不会被转换，如select * from tb_name;，因为 Hive 里的数据是直接存储在 HDFS 中的，当查询所有的信息，只需要把 HDFS 中该表的所有信息读取出来即可，没有必要转换成 MR 作业。MR 作业需要编译和任务下发等一系列操作，所以速度会慢一些。

1 3-1 Hive进阶-简单查询和fetch task

2018-06-17

白小明

# Hive 数据查询

查询语法：

SELECT [ALL|DISTINCT] select_expr, select_expr ...
FROM tb_reference
[WHERE where_condition]
[GROUP BY col_list]
[CLUSTER BY col_list
|[DISTRIBUTE BY col_list] [SORT BY col_list]
|[ORDER BY col_list]]
[LIMIT number]

- DISTRIBUTE BY：指定分发器（partitioner），多reduce可用

1 3-1 Hive进阶-简单查询和fetch task

2018-06-17

白小明

参数说明：
--connect：指定JDBC数据库连接地址，jdbc:mysql://127.0.0.1:3306/test
--user、--password：指定JDBC数据库连接用户名和密码
--table：指定RDBMS中的表名
-columns：指定导入RDBMS中表的哪些列
-m：指定导入时MR的进程数
--target-dir：指定数据导入到 HDFS 时的目录
--hive-import：数据到 Hive 中
--hive-table：指定数据导入到 Hive 时的表名
--where：使用 where 条件，来过滤一些数据
--query：使用査询语句

10 2-3 使用Sqoop进行数据的导入（下）

2018-06-17

白小明

注意：最新的稳定版本是1.4.7，Sqoop 依赖于 JDK 和 Hadoop 环境。

在官网下载最新的稳定版本：
wget http://mirrors.shu.edu.cn/apache/sqoop/1.4.7/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz

解压：tar -zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz

配置环境变量：
export SQOOP_HOME=/bigdata/sqoop-1.4.7.bin__hadoop-2.6.0
export PATH=$SQOOP_HOME/bin:$PATH

1 2-2 使用Sqoop进行数据的导入（上）

2018-06-17

Max_Cooper

hive2.0之后的版本，打开hive服务器接口的代码是：hive --service hiveserver2。这是个坑。

2 7-2 Hive的JDBC客户端操作（下）

2018-05-21

udf 类型不匹配，从text到intwriteabel

最新回答 / Max_Cooper

我试了一下，你的这个没问题，你是不是输参数的时候带上了单引号，导致参数的类型成了Text而不是IntWritable。

1 回答 1236 浏览 8-2 Hive的自定义函数案例

2018-05-18

我使用import hive导入数据，但是数据在hdfs能看到文件，但是通过hive却查不到数据

最新回答 / Max_Cooper

空的意思是null还是没有数据

1 回答 2850 浏览 2-3 使用Sqoop进行数据的导入（下）

2018-05-17

Java_beginner

竟然没人留言，哈哈哈，坐个沙发

0 8-1 Hive中的自定义函数简介

2018-04-26

hiveCLI 和beeline

最新回答 / weixin_慕慕3242689

以前是通过hivecli连接HiveServer ，缺点是HiveServer 不能处理多个客户端，比如你的HiveServer装在A机器，就必须到A机器上连接访问。所以就出现了HiveServer2，可以在任意机器上使用beeline通过JDBC方式连接。并且beeline不是直接连接的HiveServer2，二十访问的zookeeper,zookeeper中记录着多个HiveServer2地址，就算其中一个HiveServer2挂掉，也不妨碍访问。

2 回答 3049 浏览 7-1 Hive的JDBC客户端操作（上）

2018-04-16

向花开阳阳

https://www.jianshu.com/p/f239356370a2
这是根据老师讲解内容整理的课堂笔记，欢迎大家查看

2018-04-15

首页上一页 1 2 3 4 5 6 7 下一页尾页

该课程已下架

课程须知: 本课程是Hadoop体系结构的扩展内容 1、熟练掌握Hadoop的体系结构，尤其是HDFS 2、熟悉Java编程 3、了解Linux的基本操作对Hive还不了解的童鞋，最好先去《Hive旅程之初识印象》修炼一下，再回来学习

老师告诉你能学到什么？: 1、Hive数据的导入 2、Hive的数据查询 3、Hive的内置函数 4、Hive的表连接 5、Hive的子查询 6、Hive的客户端操作 7、开发Hive的自定义函数

微信扫码，参与3人拼团

热搜

最近搜索清空