最新回答 / weibo_风清绿茵_03299175
你可以运行hive时先把hive查询的结果保存在一个linux本地上的一个临时文件中,然后用linux指令把linux上的临时文件下载到本地文件中
2017-08-27
最新回答 / 慕粉1054033006
安装在Master节点。Hive的HQL最终的执行总是会转换为M/D任务的,那么自然要在JobTracker上执行,通过JobTracker交给TaskTracker执行。
2017-04-25
最赞回答 / 黄老虎
这里有两个问题:1 哈希运算2 索引关于第一个问题,我猜你是指Hive的bucket table吧?假如我没猜错,那hash计算达到的目的其实是将数据切片,这样这些数据片可以比较均匀得分布在分布式系统的不同的节点上,查询的时候呢也可以尽量运用多个节点的并行计算能力来提高查询速度。第2个问题,索引是一种数据结构,比如红黑树。设想一下,如果要从10个数字里找出任意一个数字所在的位置,如果不借助数据结构,就必须逐一核实(从位置1到位置10,一个个确认是不是要找的数字),而将数据用数据结构组织起来(二分查找法),...
2017-04-03
最新回答 / qalong
不仅是查询单个字段,涉及到函数,条件等数据处理、筛选的时候都会需要对数据进行过滤。只要涉及到了数据的过滤处理,都需要用MR来实现。select * from 可以认为是原样输出,所以不需要MR。MR任务需要编译、任务下发等一系列操作,所以速度会慢一些。
2017-03-17