走近大数据之Hive进阶_学习笔记

首页免费课走近大数据之Hive进阶笔记

走近大数据之Hive进阶

                
                赵强老师
            数据库工程师

                    查看讲师更多课程 
                    赵强老师讲师的其他课程
                
Oracle高级查询
初级·62899
免费课程
                                
Oracle触发器
初级·36902
免费课程
                                
Oracle存储过程和自定义函数
初级·56328
免费课程
                                
Oracle数据库开发必备利器之PL/SQL基础
初级·75086
免费课程
                                
                难度初级
            
                时长 2小时15分
            
                学习人数
            
综合评分9.73
                            56人评价
                        查看评价
                                9.8
                                内容实用
                            
                                9.9
                                简洁易懂
                            
                                9.5
                                逻辑清晰

最热最新

小小卢 11:53

简单查询的优化，不会生成mapreduce作业，简单查询速度更快

查看全部

0 采集收起来源：Hive进阶-简单查询和fetch task
2015-08-15
小小卢 13:57

多种方式导入

查看全部

0 采集收起来源：使用Sqoop进行数据的导入（下）
2015-08-15
小小卢 02:46

oracle导入hive中

查看全部

0 采集收起来源：使用Sqoop进行数据的导入（下）
2015-08-15
qq_大飞_3

select e.ename from emp e where e.deptno in (select d.deptno from dept d where d.dname = 'SALES' or d.dname = 'ACCOUNTING');

查看全部

0 采集收起来源：Hive中的子查询
2015-08-12
qq_大飞_3

自连接:通过表的别名将同一张表视为多张表

查看全部

0 采集收起来源：Hive-自连接
2015-08-12
qq_大飞_3

select d.deptno, d.dname, count(e.empno) ---count(e.empno)聚合函数计数 from emp e, dept d where e.deptno = d.deptno group by d.deptno, d.dname; -- 没有出现在聚合函数中的列等值连接：不成立，员工表中不存在的部门但是部门表中存在应该修改为外连接的形式：通过外连接可以将对连接条件不成立的记录仍然包含在最后的结果中。左外连接：右外连接： select d.deptno, d.dname, count(e.empno) from emp e right outer join dept d on(e.deptno = d.deptno) group by d.deptno, d.dname;

查看全部

0 采集收起来源：Hive外连接
2015-08-12
qq_大飞_3

表连接:转换成MR任务支持：等值连接（若连接条件是=） select e.empno,e.ename,e.sal,d.dname from emp e,dept d where e.deptno=d.deptno --- = 等值连接不等值连接（> < !=） select e.empno,e.ename,e.sal,s.grade from emp e,salgrade s -- 涉及两张表 where e.sal between s.losal and s.hisal 外连接、自连接

查看全部

0 采集收起来源：Hive等值连接和不等值连接
2018-03-22
qq_大飞_3

条件函数 coalesce:从左到右返回第一个不为null的值 select comm,sal,coalesce(comm, sal) from emp; case...when select ename, job, sal, case job when 'PRESIDENT' then sal+1000 when 'MANAGER' then sal+800 else sal+400 end from emp;

查看全部

0 采集收起来源：Hive条件函数
2015-08-12
qq_大飞_3

日期函数 to_date : 取出一个字符串中日期的部分 year month day weekofyear datediff ：返回日期相差的天数 date_add date_sub

查看全部

0 采集收起来源：Hive日期函数
2015-08-12
qq_大飞_3

收集函数：size（map(<key,value>,<key,value>)）转换函数：cast 进行数据类型的转换 select cast(1 as float) select cast('2014-12-10' as date)

查看全部

0 采集收起来源：Hive收集函数和转换函数
2018-03-22
qq_大飞_3

字符函数： lower upper length concat substr trim lpad -- 左填充 rpad select lower（‘hello World’） select length('Hello World'), length('你好‘） *concat select concat('Hello','World'); *substr 求字符串的子串 substr(a, b): 从a中，第b位开始取，取右边所有的字符 select sub('Hello World', 3); substr(a, b, c): 从a中，第b位开始取，取c个字符 select substr('Hello World', 3, 4); *trim 去掉前后的空格 *lpad 左填充 *rpad 右填充 select lpad('abdc', 10, '*'), rpad('abdc', 10, '*');

查看全部

0 采集收起来源：Hive字符函数
2015-08-12
qq_大飞_3

hive的函数：内置函数和自定义函数内置函数：数学函数：round、ceil、floor select round(45.926, 2),round(45.926, 1),round(45.926, 0),round(45.926, -1),round(45.926, -2) round(45.926, 2) 表示对45.926进行四色五入，保留两位小数； round(45.926, -2)

查看全部

0 采集收起来源：Hive数学函数
2015-08-12
qq_大飞_3

在查询中使用排序： select empno, ename, sal from emp order by sal; -- 默认升序排序操作，是属于高级操作，都转换成MR操作 select empno, ename, sal from emp order by sal desc; --降序 order by 后跟内容：列、表达式、别名、序号 select empno, ename, sal, sal*12 from emp order by sal*12 desc; -- 年薪的表达式 select empno, ename, sal, sal*12 annsal from emp order by annsal; -- 别名 select empno, ename, sal, sal*12 from emp order by 4 desc; -- 4代表年薪sal*12 序号，但需要设置参数： set hive.groupby.orderby.position.alias=true;(使用序号的前提条件) select empno, ename, sal, comm from emp order by comm; ---null是如何排序的？升序null排在前面，反之--

查看全部

3 采集收起来源：Hive进阶-在查询中使用排序
2015-08-12
qq_大飞_3

在查询中使用过滤：where条件 selec * from emp where deptno=10; --- 开启了fecth task 功能 select * from emp where enmae='KING'; select * from emp where enmae='king'; --- 严格区分字符串的大小写的 select * from emp where deptno=10 and sal<2000; --- 使用and连接具体的执行过程：执行计划--->explain 读的顺序从右往左从下往上 ---模糊查询 select empno,ename,sal from emp where name like 'S%'; select empno,ename,sal from emp where name like '%\\_%'; -- _代表任意的字符，本身需要用转义字符

查看全部

3 采集收起来源：Hive进阶-在查询中使用过滤
2018-03-22
qq_大飞_3

select *from emp; ---并没有转成mapreduce查询，把hdfs中对应的文件直接加载 select empno,ename,sal from emp; --- 转换层mapreduce任务不能对表进行全表扫描需要对数据进行分析速度慢的原因（1）和机器的配置有关（2）hive操作数据仓库，在海量数据下。。。支持算术表达式： select empno,ename,sal，sal*12 from emp; select empno,ename,sal，sal*12, comm,sal*12+comm from emp; 涉及到NULL值，表达式中含有NULL值，整个表达式都是NULL值把奖金为空（NULL）转换为0--> select empno,ename,sal，sal*12，comm，sal*12+nvl(comm,0) from emp; 查询奖金为NULL的员工： select * from emp where comm is null; 判断一个值是否为NULL，不能用= ！= 用is 使用distinct 去掉重复的记录 select distinct depno from emp; select distinct depno,job from emp; //组合去重 Fetch Task功能：不使用MR作业来查询，hive命令行中执行：set hive.fetch.task.conversion = more; 配置hive的参数并开启hive：hive --hiveconf hive.fetch.task.conversion = more 修改xml配置,参数如图所示：hive-site.xml

查看全部

3 采集收起来源：Hive进阶-简单查询和fetch task
2018-03-22

首页上一页 40 41 42 43 44 45 46 下一页尾页

0/150

提交

取消

该课程已下架

课程须知: 本课程是Hadoop体系结构的扩展内容 1、熟练掌握Hadoop的体系结构，尤其是HDFS 2、熟悉Java编程 3、了解Linux的基本操作对Hive还不了解的童鞋，最好先去《Hive旅程之初识印象》修炼一下，再回来学习

老师告诉你能学到什么？: 1、Hive数据的导入 2、Hive的数据查询 3、Hive的内置函数 4、Hive的表连接 5、Hive的子查询 6、Hive的客户端操作 7、开发Hive的自定义函数

微信扫码，参与3人拼团

热搜

最近搜索清空

走近大数据之Hive进阶