Hadoop基础及演练_学习笔记

首页免费课 Hadoop基础及演练笔记

Hadoop基础及演练

                
                叁金
            JAVA开发工程师

                    查看讲师更多课程 
                    叁金讲师的其他课程
                
玩转热门框架 用企业级思维 开发通用够硬的大数据平台
实战·中级·479

                                                                                                                                    ￥448.00
                                            
多层次构建企业级大数据平台， 成就全能型大数据开发
实战·高级·137

                                                                                                                                    ￥599.00
                                            
ChatGPT入门实战课 AI提效大数据开发平台建设
实战·初级·237

                                                                                                                                    ￥168.00
                                            
Calcite数据管理与SQL优化实战
初级·1103
免费课程
                                
Presto实战与演练
中级·3853
免费课程
                                
                难度初级
            
                时长 1小时 6分
            
                学习人数
            
综合评分9.30
                            51人评价
                        查看评价
                                9.4
                                内容实用
                            
                                9.1
                                简洁易懂
                            
                                9.4
                                逻辑清晰

最热最新

慕侠4279391 03:10
1. hadoop是一个开源的大数据框架。
2. hadoop是一个分布式计算的解决方案。
3. hadoop=HDFS(分布式文件系统)+MapReduce（分布式计算）
  1. hadoop核心：HDFS分布式文件系统是大数据技术的基础。
  2. MapReduce编程模型：分布式计算是大数据应用的解决方案。
查看全部

0 采集收起来源：HDFS概念及优缺点
2019-08-26
chicharit_o 02:41

HDFS 数据块存储主节点：NameNode 从节点：DataNode MapReduce：编程模型分而治之：先Map，再Reduce

查看全部

0 采集收起来源：Spark简介
2019-08-02
慕仔7523148 02:38

31421

查看全部

0 采集收起来源：HBase简介
2019-07-31
慕仔7523148 06:48

23131

查看全部

0 采集收起来源：HDFS概念及优缺点
2019-07-30
慕仔7523148 06:23

342432

查看全部

0 采集收起来源：HDFS概念及优缺点
2019-07-30
慕仔7523148 05:44

34243

查看全部

0 采集收起来源：HDFS概念及优缺点
2019-07-30
慕仔7523148 04:30

323223

查看全部

0 采集收起来源：HDFS概念及优缺点
2019-07-30
慕仔7523148 03:42

34234

查看全部

0 采集收起来源：HDFS概念及优缺点
2019-07-30
慕仔7523148 03:04

23231

查看全部

0 采集收起来源：HDFS概念及优缺点
2019-07-30
慕仔7523148 01:53

21312

查看全部

0 采集收起来源：HDFS概念及优缺点
2019-07-29
慕仔7523148 00:53

12312

查看全部

0 采集收起来源：HDFS概念及优缺点
2019-07-29
慕仔7523148 01:39

213121

查看全部

0 采集收起来源：课程简介及目标
2019-07-24
慕粉3788180 11:18

将MapReduce程序提交到Hadoop框架上

查看全部

0 采集收起来源：MapReduce实战
2019-07-01

慕粉3788180 09:58

map函数：

def red_input(file):
    for line in file:
        yield line.split()

def main():
    data = red_input(sys.stdin)

    for words in data:
        for word in words:
            print("%s%s%d"%(word,'\t',1))

reduce函数：

from itertools import groupby
from operator import itemgetter


def read_mapper_output(file,sepatator='\t'):
    for line in file:
        yield line.rstrip().split(sepatator,1)

def main():
    data = read_mapper_output(sys.stdin)

    for current_word,group in groupby(data,itemgetter(0)):
        total_count = sum(int(count) for current_word,count in group)

        print("%s%s%d"% (current_word,'\t',total_count))

执行命令

如图

查看全部

1 采集收起来源：MapReduce实战

2019-07-01

慕粉3788180

In [1]: l = ["a","bb","ccc"]
In [2]: l_count = list(map(len,l))
In [3]: l_count
Out[3]: [1, 2, 3]
In [5]: from functools import reduce
In [6]: l_sum = reduce(lambda x,y:x+y,l_count)
In [7]: l_sum
Out[7]: 6

查看全部

0 采集收起来源：MapReduce实战
2019-07-01

首页上一页 5 6 7 8 9 10 11 下一页尾页

0/150

提交

取消

开始学习

课程须知: 有Linux命令使用基础，有Python编程基础

老师告诉你能学到什么？: 大数据到底是个啥，大数据方向到底怎么样 Hadoop基础原理与两个核心 Hadoop的基础应用 Hadoop生态圈简介 Hadoop生态圈常用开源项目介绍

微信扫码，参与3人拼团

热搜

最近搜索清空

Hadoop基础及演练