已采纳回答 / qq_兵刃_04412779
块的大小设置原则:最小化寻址开小。 块越大寻址时间越短, 传输一个由多个块的组成的文件取决于磁盘传输速率。如寻址时间约为10ms,传输速率为100MB/S,为了使寻址时间仅占传输时间的1%,块的大小设置约为100MB,默认大小是64MB,现在在实际身缠中都是128MB了,随着新一代磁盘去东区传输速率的提升,块的大小将会被设置的更大。注意:块的大小太大的话,一个map任务处理一个块,那任务数就变少了,作业运行速度也就变慢了。
2018-06-02
讲师回答 / 叁金
首先我们还是要明确概念, HDFS是什么,HDFS是分布式文件存储系统。 从他的定义里面我们抽出两个词, 分布式、文件存储系统。所以HDFS的核心功能就是为用户提供更加稳定合理的文件存储方式。而HBase是什么呢,HBase是一个分布式列式数据库。从它的定义里面我们可以得出 分布式、列式、数据库几个关键词。 它首先是作为一个依托于HDFS存在的NoSql数据库,既然是一个数据库那里面存什么东西就是我们所决定的了。 HBase本身对于非结构化数据支持良好,我们同样可以将小文件直接存储...
2018-05-20
讲师回答 / 叁金
看你集群的大小和备份的数量设置了。 如果你集群有100台 备份数量是3 肯定不会备份到所有的 datanode节点啊。 注意 这里是datanode。 datanode存储数据。
2018-05-12
已采纳回答 / 叁金
将相关权限赋予指定用户。 你是在hadoop用户下执行的吧? 建议如果新建了hadoop用户的话,将hadoop的安装目录的owner设置为hadoop 这样不用过多考虑权限问题
2018-04-21