job task jobTracker TaskTracker
JobTracker:作业调度,分配任务(map任务 reduce任务),监控tasktracker状态;
tasktracker执行任务 报告状态;
MapReduce容错机制:重复执行,推测执行
JobTracker:作业调度,分配任务(map任务 reduce任务),监控tasktracker状态;
tasktracker执行任务 报告状态;
MapReduce容错机制:重复执行,推测执行
2016-06-13
客户端发送文件读请求——>namenode返回元数据(从哪些datanode找到)——>客户端读取block,下载下来之后组装;
客户端文件拆分成block——>通知namenode返回可用的 有足够磁盘空间的datanode——>客户端对block进行写入——>流水线复制——>更新元数据 ;
客户端文件拆分成block——>通知namenode返回可用的 有足够磁盘空间的datanode——>客户端对block进行写入——>流水线复制——>更新元数据 ;
2016-06-13
http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7.1/hadoop-2.7.1.tar.gz
2016-06-03
hdfs-site.xml
<property>
<name>dfs.data.dir</name>
<value>/hadoop/data</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/hadoop/data</value>
</property>
2016-06-01
配置文件
1.hadoop-env.sh 外部环境
修改JAVA_HOME
2.core-site.xml 工作目录
hadoop.tmp.dir dfs.name.dir fs.default.name
3.hdfs-site.xml 数据存放目录
dfs.data.dir
4.mapred-site.xml 任务调度器
mapred.job.tracker
5./etc/proifle 配置环境变量
HADOOP_HOME PATH
1.hadoop-env.sh 外部环境
修改JAVA_HOME
2.core-site.xml 工作目录
hadoop.tmp.dir dfs.name.dir fs.default.name
3.hdfs-site.xml 数据存放目录
dfs.data.dir
4.mapred-site.xml 任务调度器
mapred.job.tracker
5./etc/proifle 配置环境变量
HADOOP_HOME PATH
2016-05-14