为了账号安全,请及时绑定邮箱和手机立即绑定

Hadoop进阶

mooc小牧 JAVA开发工程师
难度中级
时长 3小时 3分
学习人数
综合评分9.77
31人评价 查看评价
9.9 内容实用
9.5 简洁易懂
9.9 逻辑清晰
代码: https://github.com/SkillyZ/java-spring/tree/master/skilly-hadoop/src/main/java/com/skilly/bigdata/matrix
https://github.com/SkillyZ/java-spring/tree/master/skilly-hadoop 代码

最新回答 / 陆米
懒不死你1       1_1,2_2,3_-2,4_02       1_3,2_3,3_4,4_-33       1_-2,2_0,3_2,4_34       1_5,2_3,3_-1,4_25       1_-4,2_2,3_0,4_2
mdzz 说用二维数组实现的那个,你懂这个教程的意义了吗。
内容不能少于5个字符

最新回答 / qq_世人如此功利_0
不是的,Combine在Shuffle之前Combine:在Map阶段,当所有数据处理完成后,Map Task对所有临时文件进行一次合并Shuffle:也称Copy阶段。Reduce Task从各个Map Task上远程复制一片数据,并针对某一片数据进行判断,如果其大小超过一定阀值,则写到磁盘上,否则直接放入内存中
所谓的wordcount从词面意思直接理解就是对一个单词出现的次数进行统计,首先使用split将单词给分好行,然后用map方法做一个统计,接下来shuffle就是把相同的单词放在一起,最后的reduce就是同一个单词出现的总数

最新回答 / 陆米
main里面加这一行 
BasicConfigurator.configure();
看输出日志
怎么办 感觉看不懂?

已采纳回答 / _这个昵称已被占用了_
因为老师的例子种reduce的partition只有两个,输入有3个key,所以其中必须有两个key落到同一个partition内。所有相同的key汇聚到一个partition,没毛病。所有蓝色的key都在一个partition内,所有绿色的key都在一个partition内,所有黄色的也一样。只是可能有多个key公用一个partition而已。为什么蓝色和绿色的两个key会进入到一个partition呢,这个要看具体的key的值和shuffer算法。比如:蓝色key=1,绿色key=3,黄色key=2,...
课程须知
1、在学习本课程之前,需要学习hadoop课程基础篇,即掌握MapReduce作业的基本步骤。 2、需要掌握线性代数、向量等的基本数学知识
老师告诉你能学到什么?
1、hadoop新旧版本的基本架构 2、mapreduce作业的内部原理 3、mapreduce作业重要参数的调优 4、利用hadoop缓存实现矩阵相乘 5、简单的推荐算法

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消