为了账号安全,请及时绑定邮箱和手机立即绑定

哈希运算和索引怎么提高查询效率

哈希运算和索引怎么提高查询效率,一直不大明白

正在回答

1 回答

这里有两个问题:

1 哈希运算

2 索引


关于第一个问题,我猜你是指Hive的bucket table吧?假如我没猜错,那hash计算达到的目的其实是将数据切片,这样这些数据片可以比较均匀得分布在分布式系统的不同的节点上,查询的时候呢也可以尽量运用多个节点的并行计算能力来提高查询速度。


第2个问题,索引是一种数据结构,比如红黑树。设想一下,如果要从10个数字里找出任意一个数字所在的位置,如果不借助数据结构,就必须逐一核实(从位置1到位置10,一个个确认是不是要找的数字),而将数据用数据结构组织起来(二分查找法),则可以先从中间找起来,如果找的数字比中间的位置大,则从右边继续找(也是从右半部分的中间开始查询),反之则从左边开始查。可以参考这个:http://baike.baidu.com/item/%E4%BA%8C%E5%88%86%E6%9F%A5%E6%89%BE/10628618


1 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消
走近大数据之Hive入门
  • 参与学习       54598    人
  • 解答问题       102    个

Hive是基于HDFS的数据仓库,教程将向大家介绍Hive的体系结构

进入课程

哈希运算和索引怎么提高查询效率

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信