为了账号安全,请及时绑定邮箱和手机立即绑定

最赞回答 / 慕九州4505966
应该互不影响不会会

最新回答 / 幽弥
说话一顿一顿的,感觉。。。听着不习惯

最新回答 / weibo_风清绿茵_03299175
你可以运行hive时先把hive查询的结果保存在一个linux本地上的一个临时文件中,然后用linux指令把linux上的临时文件下载到本地文件中

最新回答 / 慕粉1054033006
安装在Master节点。Hive的HQL最终的执行总是会转换为M/D任务的,那么自然要在JobTracker上执行,通过JobTracker交给TaskTracker执行。

已采纳回答 / Sha0w_Tyy
视图就是由若干的表组成的,为简化复杂查询而生成的虚表视图内不存在数据,目的只是简化查询

最赞回答 / 黄老虎
这里有两个问题:1 哈希运算2 索引关于第一个问题,我猜你是指Hive的bucket table吧?假如我没猜错,那hash计算达到的目的其实是将数据切片,这样这些数据片可以比较均匀得分布在分布式系统的不同的节点上,查询的时候呢也可以尽量运用多个节点的并行计算能力来提高查询速度。第2个问题,索引是一种数据结构,比如红黑树。设想一下,如果要从10个数字里找出任意一个数字所在的位置,如果不借助数据结构,就必须逐一核实(从位置1到位置10,一个个确认是不是要找的数字),而将数据用数据结构组织起来(二分查找法),...

最赞回答 / 汉江怪人
和mysql的用法一样 使用distinct关键字创建表 保留不同的数据

最新回答 / qalong
不仅是查询单个字段,涉及到函数,条件等数据处理、筛选的时候都会需要对数据进行过滤。只要涉及到了数据的过滤处理,都需要用MR来实现。select * from 可以认为是原样输出,所以不需要MR。MR任务需要编译、任务下发等一系列操作,所以速度会慢一些。

最新回答 / 妞给爷乐一个
还有一个问题,您说的第一种方式具体要怎样实现呢?还麻烦您能够写一下代码,万分感谢

最赞回答 / qq_笑少_0
没有分区查询这种说法吧,只有分区表的概念, 对分区表的查询和普通表的查询是一样的, 分区表的查询效率更高

最新回答 / 慕粉2015554139
列的信息也是属于元数据,也是存在derby数据库中啊。讲元数据那节有讲。

已采纳回答 / Acerreca
这里混淆了两个概念:数据仓库的更新数据仓库中数据的更新数据仓库一定要更新的,因为不断的将OLTP产生的数据通过ETL导入数据仓库中。但是,已经导入数据仓库中的数据,是不会更新的,换句话说,一条数据进入了数据仓库,就不会再做任何改变。如果想要对已有的数据进行更改,只会产生新的数据,再次倒入数据仓库。这是因为,数据仓库是用来做决策分析的。过去的所有数据,都是代表了当时的状态,所以不可以有任何改变。就像历史一样,已经成为事实的东西,是不能改变的。
课程须知
1、熟练掌握Hadoop的体系结构,尤其是HDFS 2、熟悉Java编程 3、了解Linux的基本操作
老师告诉你能学到什么?
1、数据仓库简介 2、Hive是什么? 3、Hive的体系结构 4、Hive的安装与管理 5、Hive的数据类型 6、Hive的数据模型

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消