为了账号安全,请及时绑定邮箱和手机立即绑定

Hadoop进阶

mooc小牧 JAVA开发工程师
难度中级
时长 3小时 3分
学习人数
综合评分9.77
31人评价 查看评价
9.9 内容实用
9.5 简洁易懂
9.9 逻辑清晰
在Shuffle(洗牌)阶段,key如果是字母会自动根据字典的顺序进行排序,如果是数字则升序。
请问分片是怎么分的,按文件内容还是二进制?
map3的时候转出来的是反的,不过没有影响
老师讲的非常好,不过需要各位有基础,等大家把矩阵相乘学完,再对比这个图,能够清晰的讲解出map-shuffle-reduce对应的区段,以及颜色块内对应的键值对的集合,那就学到了!我也是回头反过来才一一对应起来的。
看到后面的又反过来看前面,才开始明白,map实际代码只用处理一行,而且可以重复写相同的key,比如<1,Deer Bear Deer><2,Deer Bear Car>,map实际代码写的时候只需要处理<1,Deer Bear Deer>,并且可以写两次context.write("Deer", 1);也就是这个map在写的时候,实际上代码是context.write("Deer", 1);context.write("Bear", 1);context.write("Deer", 1);
其实我觉得完全可以用二位 数组来实现,没必要搞这么麻烦,但是作为一个教程倒是不错,学到了很多
我实际操作的时候碰到了一个\tmp permission 0700的错误,这个是hadoop在Windows系统 的bug,但是我又没办法去编译hadoop-core-xx.jar,所以我修改了下代码的这个部分private static String hdfs = "hdfs://10.187.213.237:9000";,然后编译好jar放到linux上面去,执行hadoop jar Matrix-0.0.1-SNAPSHOT.jar,最后也能成功,希望给大家一个参考
其实很好,但是很多没有讲,至少你需要配置好hadoop,hadoop连接eclipse
job.setCacheFiles(new URI[]{new Path("/20180312/cache_for_111.txt#cache111").toUri()});
split("[\t]")
不吹不黑,讲得真不赖,可得好好学!
课程须知
1、在学习本课程之前,需要学习hadoop课程基础篇,即掌握MapReduce作业的基本步骤。 2、需要掌握线性代数、向量等的基本数学知识
老师告诉你能学到什么?
1、hadoop新旧版本的基本架构 2、mapreduce作业的内部原理 3、mapreduce作业重要参数的调优 4、利用hadoop缓存实现矩阵相乘 5、简单的推荐算法

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消