-
hadoop生态圈
查看全部 -
Hadoop的核心技术
查看全部 -
,,,,
,
查看全部 -
TimeStamp时间戳:支持多版本数据同时存在
查看全部 -
Hadoop的生态圈
查看全部 -
,,,,,,
查看全部 -
在Hadoop上实操:
查看全部 -
分而治之~~
查看全部 -
随堂笔记--
查看全部 -
实战:HDFS操作
通过shell命令对HDFS进行操作:与Linux操作文件类似
通过编写Python程序对HDFS进行操作
常用HDFS Shell命令:
类Linux系统:ls、cat、mkdir、rm、chmod、chown等
HDFS文件交互:copyFromLocal、copyToLocal、get、put
查看全部 -
数据块的大小:128M
查看全部 -
Hadoop是一个开源的大数据框架;
Hadoop是一个分布式计算的解决方案;
Hadoop=HDFS(分布式文件系统)+MapReduce(分布式计算)
Hadoop基础架构:数据块、NameNode、DataNode
查看全部 -
随堂笔记--
查看全部 -
大数据是一个概念也是一门技术,是在以Hadoop为代表的大数据平台框架上进行各种数据分析的技术。
大数据包括了以Hadoop和Spark为代表的基础大数据框架
还包括实时数据处理、离线数据处理;数据分析、数据挖掘和用机器算法进行预测分析等技术
查看全部 -
包括实时数据处理
离线数据处理
数据分析、数据挖掘和用机器算法进行预测分析等技术
查看全部
举报