哈希运算和索引怎么提高查询效率
哈希运算和索引怎么提高查询效率,一直不大明白
哈希运算和索引怎么提高查询效率,一直不大明白
2017-04-03
这里有两个问题:
1 哈希运算
2 索引
关于第一个问题,我猜你是指Hive的bucket table吧?假如我没猜错,那hash计算达到的目的其实是将数据切片,这样这些数据片可以比较均匀得分布在分布式系统的不同的节点上,查询的时候呢也可以尽量运用多个节点的并行计算能力来提高查询速度。
第2个问题,索引是一种数据结构,比如红黑树。设想一下,如果要从10个数字里找出任意一个数字所在的位置,如果不借助数据结构,就必须逐一核实(从位置1到位置10,一个个确认是不是要找的数字),而将数据用数据结构组织起来(二分查找法),则可以先从中间找起来,如果找的数字比中间的位置大,则从右边继续找(也是从右半部分的中间开始查询),反之则从左边开始查。可以参考这个:http://baike.baidu.com/item/%E4%BA%8C%E5%88%86%E6%9F%A5%E6%89%BE/10628618
举报