核心:什么是HDFS(分布式文件系统), 什么是MapReduce
核心:Hadoop是一个能够对大量数据进行分布式处理的软件框架。
HDFS 分布式文件系统
YARN 分布式计算框架
MapReduce 离线计算
Spark 内存计算
Hbase 分布式数据库
Zookeeper 分布式协调服务
Hive 数据仓库