首页手记 Hadoop 2.x配置及简单MapReduce案例

Hadoop 2.x配置及简单MapReduce案例

标签：

大数据

去官网下载压缩包

配置jdk(hadoop运行在java环境上)

Hadoop 2.x基本配置及运行MapReduce案例在本地模式下

在hadoop文件下

mkdir input
cp etc/hadoop/*.xml input/
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar grep input output 'dfs[a-z.]+'cat output/part-r-00000 ##小案例mkdir wcinput
cd wcinput/
touch wc.input
vi wc.input 
    hadoop mapreduce
    hadoop hdfs
    yaen nodemanger
    hadoop resourcemanager
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar woedcount wcinput wcoutputeduce-examples-2.5.0.jar wordcount wcinput wcoutput12345678910111213141516

配置部署启动HDFS及本地模式运行MapReduce案例（使用HDFS上数据）

修改主机名：

vi /etc/sysconfig/network
vi /etc/hosts
/etc/rc.d/init.d/network restart123

修改/opt/modules/hadoop-2.5.0/etc/hadoop/core-site.xml

修改/opt/modules/hadoop-2.5.0/etc/hadoop/hdfs-site.xml

格式化hdfs

bin/hdfs namenode -format1

启动主节点

sbin/hadoop-daemon.sh start namenode1

启动从节点

sbin/hadoop-daemon.sh start datanode1

查看hadoop控制台

新增hdfs文件

bin/hdfs dfs -mkdir -p /user/beifeng/1

查询hdfs文件

bin/hdfs dfs -ls -R /1

hdfs上传文件

bin/hdfs dfs -put wcinput/wc.input /user/beifeng/mapreduce/wordcount/input/1

运行MapReduce程序

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar woedcount /user/beifeng/mapreduce/wordcount/input/ /user/beifeng/mapreduce/wordcount/output1

查看运行结果

bin/hdfs dfs -cat /user/beifeng/mapreduce/wordcount/output/part*1

配置部署启动YARN及在YARN上运行MapReduce程序

配置yarn-site.xml

<configuration>
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>

        <property>
                <name>yarn.resourcemanager.hostname</name>
                <value>min</value>
        </property></configuration>12345678910111213

配置slaves

vi etc/hadoop/slaves 

min123

启动：

sbin/yarn-daemon.sh start resourcemanager
sbin/yarn-daemon.sh start nodemanager12

访问：

配置mapred-env.sh

vi etc/hadoop/mapred-env.sh 
##修改jdk配置路径export JAVA_HOME=/usr/java/jdk1.8.0_11123

历史任务服务器启动

sbin/mr-jobhistory-daemon.sh start historyserver1

YARN的日志聚集功能配置使用

日志聚集功能配置

停止resourcemanager

sbin/yarn-daemon.sh stop resourcemanager1

停止noderesourcemanager

sbin/yarn-daemon.sh stop nodemanager1

停止历史任务服务器

sbin//mr-jobhistory-daemon.sh stop historyserver1

启动resourcemanager、resourcemanager、历史任务服务器

查看log日志

配置HDFS垃圾回收

vi etc/hadoop/core-site.xml 1

Hadoop 2.x组件启动的三种方式及配置SSH无密码登录

不建议用下面这种

配置SSH无密码登录

cd
cd .ssh
ssh-keygen -t rsa
ssh-copy-id min1234

配置namenode第二个节点

vi etc/hadoop/hdfs-site.xml1

配置历史服务器

vi etc/hadoop/mapred-site.xml1

原文出处

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

一只奥利奥的猫

学生

手记
篇

粉丝

37

获赞与收藏

205

关注作者，订阅最新文章

阅读免费教程

后端通用面试教程

41个小节 32877 371

网络编程入门教程

20个小节 13637 256

Pandas 入门教程

25个小节 20282 387

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空