作者:手机用户2502863477 | 来源:互联网 | 2023-05-19 18:22
一、存储层:文件系统HDFS,NoSQLHbase二、资源及数据管理层:YARN以及Sentry等三、计算引擎:MapReduce、Impala、Spark等四、基于M
一、存储层:文件系统HDFS,NoSQL Hbase
二、资源及数据管理层:YARN以及Sentry等
三、计算引擎:MapReduce、Impala、Spark等
四、基于MapReduce、Spark等计算引擎的高级封装及工具:Hive、Pig、Mahout等
Sqoop (Sql to Hadoop) 被设计为支持批量从结构化数据存储导入数据到HDFS,如关系数据库,企业级数据仓库和NoSQL系统。
Flume 用于移动大规模批量流数据到 HDFS 系统。从Web服务器收集当前日志文件数据到HDFS聚集用于分析