那个hadoop分布式缓存设置应该是这样的
job.addCacheFile(new Uri(cache)) 不需要加入 conf
然后我觉得在step1 对列排序再输出 对于第二步处理更快
job.addCacheFile(new Uri(cache)) 不需要加入 conf
然后我觉得在step1 对列排序再输出 对于第二步处理更快
2017-09-22
举报