-
HQL 解析器 编译器 优化器
执行计划
索引使速度变快。
查看全部 -
hive 元信息默认存储在derby里面,包含表名称,ID,表的存储位置
列的ID ,名称,以及列所在表的ID等等。
查看全部 -
Hive是基于Hadoop之上的数据仓库。
也就是说 Hive实际就是数据库。
Hive是数据仓库,数据仓库就是数据库,Hive是构建在hadoop hdfs上的数据仓库。
hive和一般意义上的数据库有什么区别
如何搭建数据库
创建的过程是什么
如何把数据导入到数据仓库
hive的体系结构是什么
hive如何与hadoop hdfs进行相互操作
hive数据与hadoop中的文件之间的关系
查看全部 -
Hive的体系结构:
Hive的元数据:
查看全部 -
Hive的基本概念:
查看全部 -
数据仓库:是一个面向主题的、集成的、不可更新的、随时间不变化的数据集合,它用于支持企业或组织的决策分析处理。
OLTP应用:联机事务处理,关注的是事物的处理,典型的OLTP应用是银行转账,一般操作频率会比较高;
OLAP应用:联机分析处理,主要面向的是查询,典型的OLAP应用是商品推荐系统,一般不会做删除和更新,数据一般都是历史数据。
数据仓库中的数据模型:星型模型和雪花模型。星型模型是数据仓库最基本的数据模型,雪花模型是在星型模型的基础上发展起来的。
查看全部 -
hive -e ‘select * from table1’不进入交互模式,执行sql语句 hive -S 静默模式,不输出mapreduce执行细节查看全部
-
Select * 不走mapreduce ,select 列走mapreduce Source xxx.sql执行sql脚本 在hive cli下用!命令执行命令查看全部
-
dfs -is查看全部
-
安装模式 1 嵌入模式 本地durby 2 本地模式 mysql和hive在同一台机器 3 远程模式 mysql和hive在不同机器查看全部
-
视图
视图不存数据 从视图中查到的数据是来自于视图所依赖的表
查看全部 -
Hive的数据模型:外部表
查看全部 -
Hive的数据模型:分区表
查看全部 -
Hive的数据模型
查看全部 -
Hive的数据存储
基于HDFS
Hive中表没有专门的数据存储格式,用文本文件或者CSV文件代表表中的数据
查看全部
举报