-
数据仓库的结构和建立过程查看全部
-
数据仓库查看全部
-
Hive 是构建在hadoop HDFS上的一个数据仓库查看全部
-
Hive是基于Hadoop之上的数据仓库查看全部
-
hive 表---》hadoop 目录 hive 表中数据---》hadoop 文件查看全部
-
视图是个虚表 1.操作视图同操作表 2.视图以来的表是基表 3.视图可以简化复杂的查询 创建方法: create view eminfo as select from where from查看全部
-
桶表: 将表中的列通过哈希运算之后相同哈希值的行进行归类。 创建方法: create table bucket_table ()cluste by(sname) into 5 buckets;查看全部
-
创建外部表的过程: 首先用 hdfs dfs -put student01.txt /input 这样在/下就有了新的目录 然后创建外部表 location'input';查看全部
-
分区表:create table partition_table()partitione d by (gender string) row foramat delimited fields terminated by ',' 可以提高查询效率 explain select * ;from 查看执行计划查看全部
-
每一个TABLE在HIVE中都有一个相应的目录存储数据 如果新建表时候没指定位置,则放在了HDFS下的/user/hive/warehouse下 location '/mytable/hive/t2' 可以在50070端口处查看信息 可以使用create table as select * from查看全部
-
内部表: 删除表时,元数据和数据都会被删除 如果不指定存储位置,内部表会存放在/usr/hive/warehouse下 手动指定存储位置: location'/mytable/hive/t2' 默认情况下表中用tab作为列与列之间的分割; 分隔符 row format delimited teminated by ','查看全部
-
HIVE是基于HADOOP之上的数据仓库,其数据都是保存在HDFS中的, hive中的表对应于HDFS上的目录 其中有文件 在HDFS中没有专门的数据存储格式,一般是文本文件或者csv文件。 表: 内部表、分区表、外部表、桶表查看全部
-
时间类型: date 年月日 timestamps:是一个数字 通过 select unix_timestamp()查看全部
-
复杂的数据类型: ARRAY 数组类型 array<float> map集合类型 map<string,float>; 组合使用的话 例如:array<map<string,float>> struct:结构类型 struct<name:string,age:int,sex:string>查看全部
-
执行一个sql语句的方法是source 文件.sql URL是啥? hive -S 进入到hive的静默模式 不进入hive命令行 在linux系统下执行hive -e ‘select * from ’查看全部
举报
0/150
提交
取消