快速入门Hadoop3.0大数据处理_技术问答

首页免费课快速入门Hadoop3.0大数据处理问答

快速入门Hadoop3.0大数据处理

                
                徐老师
            
                    查看讲师更多课程 
                    徐老师讲师的其他课程
                
徐老师带你新一代分布式调度工具-DolphinScheduler
中级·1059
免费课程
                                
徐老师带你入门新一代流式数据湖新秀--Apache Paimon
中级·838
免费课程
                                
徐老师带你 2小时 Flink SQL快速上手
中级·947
免费课程
                                
《大数据开发2024》体验课
入门·1509
免费课程
                                
3小时开启大数据之门
慕课微课·初级·391

                                                                                                                                    ￥68.00
                                            
                难度初级
            
                时长 5小时30分
            
                学习人数
            
综合评分9.77
                            18人评价
                        查看评价
                                10.0
                                内容实用
                            
                                9.6
                                简洁易懂
                            
                                9.7
                                逻辑清晰

全部评论问答未解决精华

namenode节点数

讲师回答 / 徐老师

针对你提的这个疑问：【如果集群规模比较大时，要在每一个节点上面启动 jobhistorysever岂不是很麻烦？】在生产环境下搭建大数据集群的时候，建议使用CDH或者HDP进行搭建，方便运维管理，主需要通过页面操作就可以实现hadoop集群的搭建，这些进程也都会自动启动，不需要单独手工操作。

3 回答 684 浏览 2-5 Hadoop核心架构发展历史

2020-10-26

数据倾斜问题

讲师回答 / 徐老师

针对你说的这种场景，会出现这种结果：有2个节点读取本地节点中的数据进行本地计算，另外2个节点上没有数据的，则会跨节点拉取数据进行计算。默认情况下会优先读取本节点的数据，这是最优的策略，如果由于各种原因无法满足这种策略，会退而求其次，进行跨节点数据传输

1 回答 530 浏览 2-3 分布式计算介绍

2020-10-26

hadoop jar 提交任务没有反应

讲师回答 / 徐老师

看下你代码的第32行，错误信息提示的是数组角标越界了

1 回答 1242 浏览 5-4 WordCount代码开发

2020-09-29

能发一下源码吗

讲师回答 / 徐老师

代码已上传至网盘?链接：https://pan.baidu.com/s/1JJ5AHDOd3gIXJmo6g08Btg 提取码：ghbt

1 回答 550 浏览 5-4 WordCount代码开发

2020-09-29

hadoop安装包在哪？

讲师回答 / 徐老师

官网下载地址：https://archive.apache.org/dist/hadoop/common/hadoop-3.2.0/hadoop-3.2.0.tar.gz

1 回答 628 浏览

2020-09-09

namenode和secondarynamenode都无法开启其他正常

讲师回答 / 徐老师

这里面提示的是你设置的adress设置的有问题，应该是主机名有问题你的主机名中有没有用下划线之类的特殊字符？

1 回答 1007 浏览 3-3 Hadoop伪分布集群安装部署（下）

2020-07-30

你现在的情况是hdfs的服务都起来了，所以访问192.168.100.10:9870是可以的而NodeManager 和 ResourceManager进程没起来，说明YARN服务没有起来，应该是YARN的相关配置文件修改的有问题你在启动的时候控制台有没有显示错误问题？如果没有的话到hadoop的logs目录下(/data/hadoop_repo/logs/hadoop这个目录下)看一下这个日志hadoop-root-resourcemanager-bigdata01.log，这里面会显示Resource...

3 回答 587 浏览 3-3 Hadoop伪分布集群安装部署（下）

2020-07-20