-
windows:MySql-Front查看全部
-
windows:create database hive查看全部
-
jie tu查看全部
-
Hive将元数据存储在数据库中,支持Derby,mysql,oracle数据库等,Hive默认产生的是Derby数据库查看全部
-
数据仓库的建立过程:Step1.从数据源(业务数据系统、文档资料、其他数据)中进行抽取(Extract)数据 Step2.将抽取的数据按照一定的方式读取出来,再按照一定的格式进行转换(Transform) Step3.将满足格式的数据进行装载(Load),这样数据仓库就建立起来了; 建立数据仓库以后,接下来就是提供对外服务了,此时我们需要数据仓库引擎,数据仓库引擎包含不同的服务器,不同的服务器提供不同的服务,比如“数据查询”、“数据报表”、“数据分析“还有其他各类应用,这种功能都把它叫做”前端展示“查看全部
-
Hive的数据模型和操作:表的列对应的内容就是数据模型查看全部
-
hive web interface查看全部
-
hive执行sql 脚本文件查看全部
-
Hive体系结构查看全部
-
上节回顾:Hive中的HQL语句,最终会经过编译器编译成MapReduce程序进行计算查看全部
-
执行计划(这里是查询计划!) explain plan for select * from emp where deptno10 查询执行计划(oracle中) select * from table(dbms_xplan.display) ==> dbms_xplan.display 固定写法! 全表扫描 全表扫描的效率会很低 基于员工表的部门号,创建索引 create index myindex on emp(deptno) 在查询的列上创建索引,效率会高些(全表扫描与索引扫描的区别) 然后再重新生成执行计划: explain plan for select * from emp where deptno10 再重新查看执行计划: select * from table(dbms_xplan.display)查看全部
-
HQL的执行过程 三个组件:解释器、编辑器、优化器查看全部
-
Hive的元数据是(概念): 关于“表”的信息(而不是表中单个数据项的信息),例如表的属性,存放位置,表的ID等等 这些信息存放在metastore中(而不是Hive中),而metastore是一种数据库,他支持mysql,orracl,derby等,Hive默认存放在derby数据库中。 本质: 元数据保存了表的信息和列的信息 每个表都有一个表ID 每个列都有一个列ID,并与一个表ID关联查看全部
-
Hive基本概念:是建立在Hadoop HDFS上的数据仓库基础架构 (==>Hive数据仓库中的数据是保存在HDFS上的!) 可以用来进行数据提取转化加载(ETL) 定义类SQL查询语言 ==>HQL(用户查询数据) 是HQL解析引擎,他将HQL语句转移成M/R Job然后在Hadoop执行 Hive的表其实就是HDFS的目录/文件查看全部
-
数据仓库基本概念: 数据仓库是一个面向主题的、集成的、不可更新的、随时间不变化的数据集合。它用于支持企业或组织的决策分析处理 数据仓库的结构和建立过程: 数据源->数据存储以及管理->数据仓库引擎->前端展示 星型模型、雪花模型 ETL: 利用抽取(Extract),转换(Transform),装载(Load),来提取数据。查看全部
举报
0/150
提交
取消