为了账号安全,请及时绑定邮箱和手机立即绑定

数据倾斜问题

请问老师,当集群一共有4个节点时,数据只存储在其中2个节点上,如果4个节点都参与计算时,是不是只有有数据的节点才在真正运算,剩下俩个节点都在空转划水?还是集群会重新把数据平均传输到4个节点上,大家再一起算?

正在回答

1 回答

针对你说的这种场景,会出现这种结果:

有2个节点读取本地节点中的数据进行本地计算,另外2个节点上没有数据的,则会跨节点拉取数据进行计算。

默认情况下会优先读取本节点的数据,这是最优的策略,如果由于各种原因无法满足这种策略,会退而求其次,进行跨节点数据传输

0 回复 有任何疑惑可以回复我~

举报

0/150
提交
取消

数据倾斜问题

我要回答 关注问题
意见反馈 帮助中心 APP下载
官方微信