老师讲的非常好,不过需要各位有基础,等大家把矩阵相乘学完,再对比这个图,能够清晰的讲解出map-shuffle-reduce对应的区段,以及颜色块内对应的键值对的集合,那就学到了!我也是回头反过来才一一对应起来的。
2018-03-15
看到后面的又反过来看前面,才开始明白,map实际代码只用处理一行,而且可以重复写相同的key,比如<1,Deer Bear Deer><2,Deer Bear Car>,map实际代码写的时候只需要处理<1,Deer Bear Deer>,并且可以写两次context.write("Deer", 1);也就是这个map在写的时候,实际上代码是context.write("Deer", 1);context.write("Bear", 1);context.write("Deer", 1);
2018-03-15
我实际操作的时候碰到了一个\tmp permission 0700的错误,这个是hadoop在Windows系统 的bug,但是我又没办法去编译hadoop-core-xx.jar,所以我修改了下代码的这个部分private static String hdfs = "hdfs://10.187.213.237:9000";,然后编译好jar放到linux上面去,执行hadoop jar Matrix-0.0.1-SNAPSHOT.jar,最后也能成功,希望给大家一个参考
2018-03-15
job.setCacheFiles(new URI[]{new Path("/20180312/cache_for_111.txt#cache111").toUri()});
2018-03-13