简介:在大数据日益火爆的今天,很多猿友都将其作为自己以后的职业方向,本门课程本着细化提取概念点并逐步应用的原则,对大数据生态做了简单的介绍并着重的讲述了开源大数据框架Hadoop的使用和原理。并对Hadoop生态圈的其他开源项目做了简单的介绍,以帮助我们快速的构建大数据的知识图谱。另外讲师的实战课《HBase+SpringBoot实战分布式文件存储》已经上线 https://coding.imooc.com/class/205.html,有兴趣的小伙伴可以进行深入学习~
第1章 初识大数据
大家对于大数据肯定是不陌生了,但是我们应该怎样去定义大数据呢,大数据这个方向到底有没有前途呢,本章节坚定你学习大数据的决心。
第2章 Hadoop核心HDFS
了解HDFS的基本概念,熟悉HDFS读写流程。并在了解原理的基础上实际操作,通过shell命令与python程序访问HDFS加深对HDFS的理解。
第3章 Hadoop核心MapReduce
了解MapReduce编程模型,了解Yarn资源调度框架。并通过开发简单的MapReduce示例程序学习其分而治之的编程思想
第4章 Hadoop生态圈介绍
简单介绍Hadoop的生态圈,并对现在常用的分布式数据库HBase和分布式内存计算框架Spark进行简单介绍,帮助我们构建大数据知识图谱。
解锁即可观看《大数据工程师》完整课程视频
大数据工程师
硬核技能带你攻克热点商业项目,从入门直达中级工程师水平,掌握DT时代淘金利器!
【第1周】学好大数据先攻克Linux
【第2周】大数据起源之初识Hadoop
【第3周】Hadoop之HDFS的使用
【第4周】Hadoop之HDFS核心进程剖析
【第5周】Hadoop之初识MR
【第6周】拿来就用的企业级解决方案
【第7周】Flume从0到高手一站式养成记
【第8周】数据仓库Hive从入门到小牛
【第9周】Hive扩展内容
【第10周】快速上手NoSQL数据库HBase
【第11周】数据分析引擎之Impala
【第12周】7天极速掌握Scala语言
【第13周】Spark快速上手
【第14周】Spark性能优化的道与术
【第15周】Spark3.x扩展内容
【第16周】综合项目:电商数据仓库之用户行为数仓
【第17周】综合项目:电商数据仓库之商品订单数仓
【第18周】消息队列之Kafka从入门到小牛
【第19周】极速上手内存数据库Redis
【第20周】Flink快速上手篇
【第21周】Flink高级进阶之路
【第22周】Flink1.15新特性及状态的使用
【第23周】Flink1.15之状态的容错与一致性
【第24周】FlinkSQL(1.15)快速上手
【第25周】FlinkSQL双流JOIN详解
【第26周】全文检索引擎Elasticsearch
【第27周】Es+HBase仿百度搜索引擎项目
【第28周】直播平台三度关系推荐V1.0
【第29周】直播平台三度关系推荐V2.0
【第30周】数据中台大屏
【第31周】实时OLAP引擎之ClickHouse
【第32周】实时数仓-Kafka Eagle+DS
【第33周】实时数仓-Flink CDC数据采集
【第34周】实时数仓-Paimon(数据湖)快速上手
【第35周】实时数仓-Paimon(数据湖)高级进阶
【第36周】实时数仓-湖仓一体项目
【第37周】一站式流式开发平台StreamPark
【第38周】大数据分布式SQL网关Kyuubi