-
1.create table t1(tid int,tname string, age int); --默认存储在 '/user/hive/warehouse' 2.指定存储目录:create table t2(tid int,tname string,age int) location '/mytable/hive/t2'; 3.指定分隔符:create table t1(tid int,tname string, age int) row format delimited fields terminated by ','; 4.使用查询语句创建新表:create table t4 as select * from sample_data; 5.查看t4表的文件:hdfs dfs -cat /user/hive/warehouse/t4/000000_0 6.create table t5 row format delimited fields terminated by ',' as select * from sample_data; 7.alter table t1 add columns(english int); 8.查看表结构:desc t1; 9.drop table t1;查看全部
-
1. 数组类型:create table student(sid int, sname string, grade array<float>); 插入数据:{1, Tom, [80, 90, 75]} 2. 集合类型:create table student1(sid int, sname string, grade map<string, float>); 插入数据:{1, Tom, <'大学语文', 85>} 3. create table student3(sid int, sname string, grades array<map<sring, float>>); 插入数据:{1, Tom, [<'大学语文',80>,<'大学英语',90>]} 4. 结构类型:create table student4(sid int,info struct<name:string,age:int,sex:string>); 插入数据:{1,{'Tom',10,'男'}}查看全部
-
Hive是建立在Hadoop HDFS(Hadoop分布式文件系统)上的数据仓库基础架构,可以用了进行数据的提取转化加载(ETL)。Hive定义了类SQL查询语句,称为HQL Hive允许MapReduce开发者自定义Mapper和Reducer来完成复杂操作。 实际上,Hive是通过SQL解析引擎(或者准确的说是HQL解析引擎)将一个查询语句转换成了map和reduce程序,然后放在Hadoop上执行,并把执行结果返回给用户。 Hive数据仓库的建立工具。 Hive中的表就是HDFS的目录和文件,HIVE的数据就是HDFS的数据。查看全部
-
星型模型:一个主题,其他都是围绕主体的信息。 雪花信息:多个主题,没一个主题可能都有其他的信息围绕。查看全部
-
数据仓库的建立: (1)抽取(Extract),从数据源中提取数据; (2)转换(Transfrom),将数据格式转换成数据仓库符合的类型; (3)装载(Load),将满足格式的数据存于数据仓库 数据仓库的结构: (1)数据源 (2)数据存储管理(ETL) (3)数据仓库引擎(里面有很多服务器,不同的服务器提供不同的服务例如:数据查询,数据报表,数据分析等) (4)前端展示,即把查询结果,报表,分析结果等在前段呈现查看全部
-
数据仓库也是一种数据库,但有以下特点: (1)是面向主题的,即有一个主要的内容类别; (2)是集成的,即可以从多处取数据集成,例如从某文本,oracle,mysql等 数据源中获取 (3)不可更新更改,删除操作,一般只是为了满足做数据分析而进行数据的查询操作。(这一点不同于普通数据库)查看全部
-
hive体系结构查看全部
-
结构图查看全部
-
Hive视图查看全部
-
Hive的数据模型--视图查看全部
-
外部表查看全部
-
分区表查看全部
-
Hive内部表查看全部
-
Hive的复杂数据类型查看全部
-
Hive的基本数据类型查看全部
举报
0/150
提交
取消