课程
/云计算&大数据
/大数据
/快速入门Hadoop3.0大数据处理
Map的局部聚合虽然是可选项,执行局部聚合与不执行局部聚合,对于全局数据的清洗到聚合的全流程来说,性能有影响嘛?
2019-12-26
源自:快速入门Hadoop3.0大数据处理 5-2
正在回答
提前进行map的局部聚合,会提高性能,因为聚合后map端通过shuffle发送到reduce端的数据就少了,对应的就减少了网络传输的时间
举报
快速入门Hadoop3.0数据处理,轻松迈入大数据领域
2 回答关于reduce变量共享问题
4 回答部署hadoop
1 回答中间数据存储在map中,数据量大能能解决吗?
3 回答关于启动后的出现的服务数量
1 回答怎么安装部署?