为了账号安全,请及时绑定邮箱和手机立即绑定

Hadoop进阶

mooc小牧 JAVA开发工程师
难度中级
时长 3小时 3分
学习人数
综合评分9.77
31人评价 查看评价
9.9 内容实用
9.5 简洁易懂
9.9 逻辑清晰
很不错。很详细。
添加一个log4j.properties就可以打印日志了
其实可以直接本地调试的,对于新手来说友好一点,配置连接hadoop服务器的环境能折腾死新手
https://www.polarxiong.com/archives/Hadoop-Intellij%E7%BB%93%E5%90%88Maven%E6%9C%AC%E5%9C%B0%E8%BF%90%E8%A1%8C%E5%92%8C%E8%B0%83%E8%AF%95MapReduce%E7%A8%8B%E5%BA%8F-%E6%97%A0%E9%9C%80%E6%90%AD%E8%BD%BDHadoop%E5%92%8CHDFS%E7%8E%AF%E5%A2%83.html
感谢老师的精彩授课!
Hadoop 1.2.1版本

private static String cache = "/ItemCF/step1_output1/part-r-00000.txt";

DistributedCache.addCacheFile(new URI("/ItemCF/step1_output1/part-r-00000#itemUserScore1"),conf);
厉害厉害,简单明了,就是基础篇部分讲的少了点
Mapper2步骤的时候有一些小问题,进行相似度分母计算时,按照下划线分割后进行分值相乘的数据应该是位置为1的数据。
声音好听 可以加老师微信?
reduce的合并是无序的吧,所以这个合并的结果也是错的吧,可能后边会再排序?
【矩阵转置操作】设A为m×n阶矩阵(即m行n列),第i 行j 列的元素是a(i,j),即:A=a(i,j),定义A的转置为这样一个n×m阶矩阵B,满足B=a(j,i),即 b (i,j)=a(j,i)(B的第i行第j列元素是A的第j行第i列元素),记A'=B。(有些书记为AT=B,这里T为A的上标)
代码: https://github.com/SkillyZ/java-spring/tree/master/skilly-hadoop/src/main/java/com/skilly/bigdata/matrix
https://github.com/SkillyZ/java-spring/tree/master/skilly-hadoop 代码
mdzz 说用二维数组实现的那个,你懂这个教程的意义了吗。
内容不能少于5个字符
所谓的wordcount从词面意思直接理解就是对一个单词出现的次数进行统计,首先使用split将单词给分好行,然后用map方法做一个统计,接下来shuffle就是把相同的单词放在一起,最后的reduce就是同一个单词出现的总数
课程须知
1、在学习本课程之前,需要学习hadoop课程基础篇,即掌握MapReduce作业的基本步骤。 2、需要掌握线性代数、向量等的基本数学知识
老师告诉你能学到什么?
1、hadoop新旧版本的基本架构 2、mapreduce作业的内部原理 3、mapreduce作业重要参数的调优 4、利用hadoop缓存实现矩阵相乘 5、简单的推荐算法

微信扫码,参与3人拼团

意见反馈 帮助中心 APP下载
官方微信
友情提示:

您好,此课程属于迁移课程,您已购买该课程,无需重复购买,感谢您对慕课网的支持!

本次提问将花费2个积分

你的积分不足,无法发表

为什么扣积分?

本次提问将花费2个积分

继续发表请点击 "确定"

为什么扣积分?

举报

0/150
提交
取消