简介:大数据时代已经到来,越来越多的行业面临着大量数据需要存储以及分析的挑战。Hadoop,作为一个开源的分布式并行处理平台,以其高扩展、高效率、高可靠等优点,得到越来越广泛的应用。本课旨在培养学员理解Hadoop的架构设计以及掌握Hadoop的运用能力。
第1章 初识Hadoop
本章讲述课程大纲,授课内容,授课目标、预备知识等等,介绍Hadoop的前世今生,功能与优势
第2章 Hadoop安装
本章通过案例的方式,介绍Hadoop的安装过程,以及如何管理和配置Hadoop
第3章 Hadoop的核心-HDFS简介
本章重点讲解Hadoop的组成部分HDFS的体系结构、读写流程,系统特点和HDFS的使用。
第4章 Hadoop的核心-MapReduce原理与实现
本章介绍MapReduce的原理,MapReduce的运行流程,最后介绍一个经典的示例WordCount
第5章 开发Hadoop应用程序
本章介绍在Hadoop下开发应用程序,涉及多个典型应用,包括数据去重,数据排序和字符串查找。