走近大数据之Hive入门_学习笔记

首页免费课走近大数据之Hive入门笔记

走近大数据之Hive入门

                
                赵强老师
            数据库工程师

                    查看讲师更多课程 
                    赵强老师讲师的其他课程
                
Oracle高级查询
初级·62862
免费课程
                                
Oracle触发器
初级·36886
免费课程
                                
Oracle存储过程和自定义函数
初级·56308
免费课程
                                
Oracle数据库开发必备利器之PL/SQL基础
初级·75048
免费课程
                                
                难度初级
            
                时长 2小时21分
            
                学习人数
            
综合评分9.83
                            98人评价
                        查看评价
                                10.0
                                内容实用
                            
                                9.8
                                简洁易懂
                            
                                9.7
                                逻辑清晰

最热最新

aA木杉Aa

*桶表桶表通过哈希运算，把运算出的相同哈希值放在一起，以减少热块 create table bucket_table (name string,age int) clustered by(name)into 5 buckets; --五个桶

查看全部

0 采集收起来源：Hive的数据模型之桶表
2017-07-03
aA木杉Aa 02:57

*外部表（External Table） -指向已经在HDFS中存在的数据，可以创建Partition -它和内部表在元数据的组织上是相同的，而实际数据的存储则又较大的差异 -外部表只有一个过程，加载数据和创建表同时完成，并不会移动到数据仓库目录中，只是与外部数据建立一个链接。当删除一个外部表时，仅删除该链接。 *创建外部表 dfs -put student01.txt /input dfs -put student02.txt /input dfs -put student03.txt /input create external table external_student (sid int, sname string, age int) row format delimited fields terminated by ',' location '/input';--数据源的HDFS文件目录

查看全部

0 采集收起来源：Hive的数据模型之外部表
2017-07-03
aA木杉Aa

* 分区表 create table partition_table(sid int ,sname string) partitioned by(gender string) row format delimited fields termimated by ','; insert into table partition_table partition(gender='M') select sid,sname from t1 where gender ='M'; insert into table partition_table partition(gender='F') select sid,sname from t1 where gender ='F'; 执行计划： explain select * from table

查看全部

0 采集收起来源：Hive的数据模型之分区表
2017-07-03
aA木杉Aa

*内部表（Table） -在HDFS上某个目录存储所有表数据（不包括External Table） -删除表时，元数据与数据都会被删除 -------------------------------------------------- create table t1(tid int, tname string, age int); --1.保存在默认文件夹 create table t2(tid int, tname string, age int) location '/mytable/hive/t2'; --2.指定保存位置 create table t3(tid int, tname string, age int) row format delimited fields terminated by ','; --3.指明列分隔符 create table t4 as select * from sample_data; --4.通过查询来创建有数据的内部表 create table t5 row format delimited fields terminated by ',' as select * from sample_data; --alter table t1 add columns(english int); drop table t1;

查看全部

0 采集收起来源：Hive的数据模型之内部表
2017-07-03
aA木杉Aa

Hive默认采用Tab作为列分割符，可以是任意分割符 --Table内部表 --Partition 分区表 --External Table 外部表 --Bucket Table桶表

查看全部

0 采集收起来源：Hive的数据存储
2017-07-03
aA木杉Aa

*Hive的时间类型 -Date:日期，年月日，YYYY-MM-DD格式 -Timestamp：时间戳，长整形数格式

查看全部

0 采集收起来源：Hive的数据类型之时间数据类型
2017-07-02
aA木杉Aa

复杂数据类型: 1. 数组类型：create table student(sid int, sname string, grade array<float>); 插入数据：{1, Tom, [80, 90, 75]} 2. 集合类型：create table student1(sid int, sname string, grade map<string, float>); 插入数据：{1, Tom, <'大学语文', 85>} 3. create table student3(sid int, sname string, grades array<map<sring, float>>); 插入数据：{1, Tom, [<'大学语文',80>,<'大学英语',90>]} 4. 结构类型：create table student4(sid int,info struct<name:string,age:int,sex:string>); 插入数据：{1,{'Tom',10,'男'}}

查看全部

0 采集收起来源：Hive的数据类型之复杂数据类型
2018-03-22
aA木杉Aa

基本数据类型整数类型 tinyint smallint int bigint 浮点数类型 float、double 布尔类型 boolean string 字符串类型 * Hive 0.13版本后支持类似关系型数据中的, VARCHAR, CHAR类型数据.

查看全部

0 采集收起来源：Hive的数据类型之基本数据类型
2017-07-02
aA木杉Aa

hive的web管理界面的开启: 启动web管理服务hive --service hwi 编译war包：src/hwi jar cvfM0 hive-hwi-0.13.0.war -C web/ . 拷贝到hive的lib目录下修改hive-site.xml cp jdk/lib/tools.jar hive/lib/

查看全部

0 采集收起来源：Hive的管理之web界面方式
2017-07-02
aA木杉Aa

常用命令: 1. 查看HDFS上的文件 - dfs -ls /usr 2. 执行操作系统命令 -! 命令 *静默模式(无log显示) hive -S -e 'source /home/hadoop/my1.sql' 执行HQL: hive -e 'HQL语句' CLI下可以source SQL文件执行

查看全部

0 采集收起来源：Hive的管理之CLI方式
2017-07-02
aA木杉Aa 00:59

hive的体系结构

查看全部

0 采集收起来源：Hive的体系结构
2017-07-02
aA木杉Aa

SQL解析引擎：解释器---编译器----优化器执行计划: explain plan for select * from emp where deptno10 查询执行计划（oracle中） select * from table(dbms_xplan.display) ==> dbms_xplan.display 固定写法! 全表扫描的效率会很低基于员工表的部门号，创建索引 create index myindex on emp(deptno) 在查询的列上创建索引，效率会高,然后再重新生成执行计划： explain plan for select * from emp where deptno10 再重新查看执行计划： select * from table(dbms_xplan.display）

查看全部

0 采集收起来源：Hive的体系结构之HQL的执行过程
2018-03-22
aA木杉Aa

Hive的元数据：关于“表”本身的信息，例如表的属性，存放位置，表的ID等等这些信息存放在metastore中（而不是Hive中），而metastore是一种数据库，他支持mysql,orracl,derby等，Hive默认存放在derby数据库中。本质：元数据保存了表的信息和列的信息(表ID,列ID与表ID关联)

查看全部

0 采集收起来源：Hive的体系结构之元数据
2017-07-02
aA木杉Aa

Hive: Hive是建立在Hadoop HDFS上的数据仓库基础架构 Hive可以用来进行数据提取转化加载（ETL） Hive定义了简单的类似SQL查询语言，称为HQL它允许熟悉SQL的用户查询数据 Hive允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作

查看全部

0 采集收起来源：什么是Hive
2017-07-02
aA木杉Aa

数据仓库是面向主题的、集成的（对数据进行了抽取的集合）、不可更新的、不随时间变化的数据集合，主要用于企业或公司决策和分析

查看全部

0 采集收起来源：数据仓库简介
2017-07-02

首页上一页 27 28 29 30 31 32 33 下一页尾页

0/150

提交

取消

该课程已下架

课程须知: 1、熟练掌握Hadoop的体系结构，尤其是HDFS 2、熟悉Java编程 3、了解Linux的基本操作

老师告诉你能学到什么？: 1、数据仓库简介 2、Hive是什么？ 3、Hive的体系结构 4、Hive的安装与管理 5、Hive的数据类型 6、Hive的数据模型

微信扫码，参与3人拼团

热搜

最近搜索清空

走近大数据之Hive入门