请教一下Hadoop的本质是否理解正确?
我想请教一下,通俗来讲,可否这么理解Hadoop?
相当于跑在linux上的,一个可以一台也可以多台集群的虚拟“操作系统”(就像装虚拟机玩一样),但这个“系统”(HDFS),可以帮我们把所有其他物理节点的硬盘、CPU资源,全部集中调度了。我们只需要把所有的集群电脑看成一台大的、性能超强的“电脑”或大型存储就行。
然后内部的处理,类似一个巨大的MongoDB,我们把数据按照 KEY/VALUE 的结构,往这个大型的“系统”里面扔,还可以写一些程序,按照我们自己的逻辑,从数据库里面取得数据,算出结果。只不过传统的SQL,MongoDB是跑在一台机器上的,而Hadoop是可以分布的,不需要我们管它怎么去分布,我们向它发统一的命令,它给我们结果。
不一定准确,但不知道这样的通俗理解,是否正确?谢谢指教!