-
[-p]、[-r]递归创建
查看全部 -
本地的schema是file,端口号默认是9000
查看全部 -
HDFS不适合存储小文件
查看全部 -
要保证服务端配置文件和客户端配置文件一样即可
查看全部 -
不要重复格式化,如果因为格式化出问题,删掉hadoop_repo再格式化一次
查看全部 -
数据清洗,数据计算,展示
查看全部 -
工作中CDH和HDP多
查看全部 -
大数据生态圈
查看全部 -
1.0:mapreduce还有资源管理的功能,没有解耦合
2.0:增加yarn,专门实现资源管理
3.0:优化,hdfs中namenode主节点可以有两个
查看全部 -
yarn架构分析
从节点(NodeManager)资源管理包含CPU和内存资源
查看全部 -
mapreduce架构分析
查看全部 -
hdfs架构分析
主节点最多可以有两个
查看全部 -
三大核心组件
查看全部 -
分布式计算
查看全部 -
磁盘io从数据库获得数据,再通过网络io将数据传到计算程序,网络io消耗时间,数据移动到计算程序,数据量大时慢。而将计算程序移动到数据节点时速度快,此时就是一个本地计算
查看全部
举报
0/150
提交
取消