认识Hadoop--基础篇_学习笔记

首页免费课认识Hadoop--基础篇笔记

认识Hadoop--基础篇

最热最新

慕设计2293045 00:56
Hdfs的特点：
1. 数据冗余，硬件容错（3个备份）
2. 流式的数据访问（一次写入，多次读取，无法删改，只能通过写入到新的块删除旧文件）
3. 存储大文件（否则namenode消耗高，头大身小）
实用性和局限性：
- 适合数据批量读写，吞吐量高
- 不适合交互式应用，低延迟很难满足
- 适合一次写入多次读取，顺序读写
- 不支持多用户并发写相同文件
查看全部

0 采集收起来源：HDFS特点
2021-07-12
慕设计2293045 02:47

Hdfs文件读取流程：
Hdfs文件写入流程：

查看全部

0 采集收起来源：HDFS中文件的读写操作
2021-07-12
慕设计2293045 02:51
Hdfes数据管理：
1. 数据块副本：每个数据块3个副本，分布在2机架3节点上（容错性）
2. 心跳检测：DataNode定期向NameNode发心跳消息，刷新存在感!!

3. 二级NameNode：NameNdoe定期同步元数据映像文件到二级NameNode（secondryNameNode）,一旦故障，备胎转正，成正宫娘娘！
查看全部

0 采集收起来源：数据管理策略
2021-07-12
慕设计2293045 02:24
HDFS的文件被分成块进行存储，HDFS块默认大小是64MB，快是整个文件存储处理的逻辑单元
HDFS中有两类节点NameNode和DataNode
namenode是管理节点，存放文件元数据，元数据包含两个部分
- 文件与数据快的映射表
- 数据块与数据节点的映射表
namenode是唯一的管理节点，里面存放大量元数据，客户进行访问请求，首先会到namenode查看元数据，这个文件放在哪些节点上面然后从这些节点拿数据块，然后组装成想要的文件
DateNode是HDFS的工作节点，存放数据块
查看全部

0 采集收起来源：HDFS基本概念
2021-07-12
Ricky_Huang 00:22

3

查看全部

0 采集收起来源：Hadoop大数据平台架构与实践课程简介
2022-02-25
qq_慕运维5207995 05:31

需要配置Hadoop的环境变量

查看全部

0 采集收起来源：Hadoop安装-配置hadoop
2021-05-03
akabla
hdfs：
1. 高成本
2. 低成本
3. 成熟生态圈
  hive
查看全部

0 采集收起来源：Hadoop的功能与优势
2021-03-04
akabla

Hadoop

查看全部

0 采集收起来源：Hadoop的前世今生
2021-03-04
老四2905904

大数据是个好东西

查看全部

0 采集收起来源：Hadoop大数据平台架构与实践课程简介
2021-02-14