作者:梅子青时梦 | 来源:互联网 | 2023-05-25 10:58
这是一种明显的,我们都会同意,我们可以称之为HDFS + YARN + MapReduce
是Hadoop的.但是,Hadoop生态系统中不同的其他组合和其他产品会发生什么?
例如,HDFS + YARN + Spark
仍然是Hadoop?是HBASE
Hadoop吗?我想我们考虑HDFS + YARN + Pig
Hadoop,因为Pig使用MapReduce.
只有MapReduce工具被认为是Hadoop,但其他任何运行的东西HDFS + YARN
(如Spark)都是非Hadoop吗?
1> Daniel Darab..:
我同意你的印象,即"Hadoop"这个术语没有一个有用的定义."我们有一个Hadoop集群"可能意味着各种各样的事情.
在http://hadoop.apache.org/#What+Is+Apache+Hadoop%3F上有一个官方答案:
Apache™Hadoop®项目开发了用于可靠,可扩展的分布式计算的开源软件.
Apache Hadoop软件库是一个框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集.
所以"Hadoop"是项目和软件库的名称.任何其他用法都是不明确的.