走近大数据之Hive入门_技术问答

首页免费课走近大数据之Hive入门问答

走近大数据之Hive入门

                
                赵强老师
            数据库工程师

                    查看讲师更多课程 
                    赵强老师讲师的其他课程
                
Oracle高级查询
初级·63048
免费课程
                                
Oracle触发器
初级·36972
免费课程
                                
Oracle存储过程和自定义函数
初级·56421
免费课程
                                
Oracle数据库开发必备利器之PL/SQL基础
初级·75237
免费课程
                                
                难度初级
            
                时长 2小时21分
            
                学习人数
            
综合评分9.83
                            98人评价
                        查看评价
                                10.0
                                内容实用
                            
                                9.8
                                简洁易懂
                            
                                9.7
                                逻辑清晰

全部评论问答未解决精华

hive默认的安装模式是嵌入式的？

最新回答 / 阿阿影

是的吧

1 回答 474 浏览 3-3 Hive安装之远程模式和本地模式

2017-10-22

hive-partition and bucket

最赞回答 / 慕九州4505966

应该互不影响不会会

2 回答 1317 浏览 7-1 总结

2017-10-19

收获挺多的

最新回答 / 幽弥

说话一顿一顿的，感觉。。。听着不习惯

2 回答 933 浏览 3-1 Hive的安装模式

2017-09-14

hive查询的表结果数据导出来

最新回答 / weibo_风清绿茵_03299175

你可以运行hive时先把hive查询的结果保存在一个linux本地上的一个临时文件中，然后用linux指令把linux上的临时文件下载到本地文件中

1 回答 1453 浏览 3-2 Hive安装之嵌入模式

2017-08-27

hadoop的集群模式下，hive安装在hadoop的那个节点下？

最新回答 / 慕粉1054033006

安装在Master节点。Hive的HQL最终的执行总是会转换为M/D任务的，那么自然要在JobTracker上执行，通过JobTracker交给TaskTracker执行。

1 回答 3621 浏览 3-3 Hive安装之远程模式和本地模式

2017-04-25

视图和外部表什么区别呢

已采纳回答 / Sha0w_Tyy

视图就是由若干的表组成的，为简化复杂查询而生成的虚表视图内不存在数据，目的只是简化查询

1 回答 1514 浏览 6-6 Hive的数据模型之视图

2017-04-03

这里有两个问题：1 哈希运算2 索引关于第一个问题，我猜你是指Hive的bucket table吧？假如我没猜错，那hash计算达到的目的其实是将数据切片，这样这些数据片可以比较均匀得分布在分布式系统的不同的节点上，查询的时候呢也可以尽量运用多个节点的并行计算能力来提高查询速度。第2个问题，索引是一种数据结构，比如红黑树。设想一下，如果要从10个数字里找出任意一个数字所在的位置，如果不借助数据结构，就必须逐一核实（从位置1到位置10,一个个确认是不是要找的数字），而将数据用数据结构组织起来（二分查找法），...

1 回答 1179 浏览 6-5 Hive的数据模型之桶表

2017-04-03

外部表有重复数据怎么解决呢

最赞回答 / 汉江怪人

和mysql的用法一样使用distinct关键字创建表保留不同的数据

1 回答 886 浏览 6-4 Hive的数据模型之外部表

2017-04-03

单个字段查询

最新回答 / qalong

不仅是查询单个字段，涉及到函数，条件等数据处理、筛选的时候都会需要对数据进行过滤。只要涉及到了数据的过滤处理，都需要用MR来实现。select * from 可以认为是原样输出，所以不需要MR。MR任务需要编译、任务下发等一系列操作，所以速度会慢一些。

2 回答 909 浏览 4-1 Hive的管理之CLI方式

2017-03-17

关于修改的问题

已采纳回答 / qq_塑料袋儿_0

<...code...><...code...>

2 回答 1213 浏览 6-2 Hive的数据模型之内部表

2017-03-11

关于添加数据

最新回答 / 妞给爷乐一个

还有一个问题，您说的第一种方式具体要怎样实现呢？还麻烦您能够写一下代码，万分感谢

5 回答 1089 浏览 6-2 Hive的数据模型之内部表

2017-03-11

关于分区查询

最赞回答 / qq_笑少_0

没有分区查询这种说法吧，只有分区表的概念，对分区表的查询和普通表的查询是一样的，分区表的查询效率更高

3 回答 967 浏览 6-3 Hive的数据模型之分区表

2017-03-08

静默模式的错误状态

最新回答 / 张生工作室

不会有

1 回答 769 浏览 4-1 Hive的管理之CLI方式

2017-02-26

元数据默认是存储在derby中，列的信息是保存在哪个路径下呢？

最新回答 / 慕粉2015554139

列的信息也是属于元数据，也是存在derby数据库中啊。讲元数据那节有讲。

1 回答 1551 浏览 2-2 Hive的体系结构之HQL的执行过程

2017-02-26

数据仓库不可以更新，那数据怎么存进数据库里面，存了不就是更新了？

已采纳回答 / Acerreca

这里混淆了两个概念：数据仓库的更新数据仓库中数据的更新数据仓库一定要更新的，因为不断的将OLTP产生的数据通过ETL导入数据仓库中。但是，已经导入数据仓库中的数据，是不会更新的，换句话说，一条数据进入了数据仓库，就不会再做任何改变。如果想要对已有的数据进行更改，只会产生新的数据，再次倒入数据仓库。这是因为，数据仓库是用来做决策分析的。过去的所有数据，都是代表了当时的状态，所以不可以有任何改变。就像历史一样，已经成为事实的东西，是不能改变的。

1 回答 3338 浏览 1-2 数据仓库简介

2017-02-24

首页上一页 1 2 3 4 5 6 7 下一页尾页

该课程已下架

课程须知: 1、熟练掌握Hadoop的体系结构，尤其是HDFS 2、熟悉Java编程 3、了解Linux的基本操作

老师告诉你能学到什么？: 1、数据仓库简介 2、Hive是什么？ 3、Hive的体系结构 4、Hive的安装与管理 5、Hive的数据类型 6、Hive的数据模型

微信扫码，参与3人拼团

热搜

最近搜索清空

走近大数据之Hive入门