作者:缤纷之铃6868 | 来源:互联网 | 2023-08-31 04:15
Cloudera是ApacheHadoop的一个发行版本,为企业部署一个基于Hadoop的数据平台提供了方便。FeaturesHDFS–Selfhealingdistribu
Cloudera 是Apache Hadoop的一个发行版本,为企业部署一个基于Hadoop的数据平台提供了方便。
Features
- HDFS – Self healing distributed file system(可自我修复的分布式文件系统)
- MapReduce – Powerful, parallel data processing framework(并行数据处理框架)
- Hadoop Common – a set of utilities that support the Hadoop subprojects(一些支持hadoop子项目的工具集)
- HBase – Hadoop database for random read/write access(支持随机读写访问的Hadoop数据库)
- Hive – SQL-like queries and tables on large datasets(对大表的类似SQL形式的查询)
- Pig – Dataflow language and compiler(一种支持数据流的语言和编译器)
- Oozie – Workflow for interdependent Hadoop jobs(Hadoop job的工作流)
- Sqoop – Integrate databases and data warehouses with Hadoop(将数据库和数据仓库集成到Hadoop)
- Flume – Highly reliable, configurable streaming data collection(高可靠,可配置的流数据)
- Zookeeper – Coordination service for distributed applications(分布式应用程序的互操作服务)
- Hue – User interface framework and SDK for visual Hadoop applications( 可视化 Hadoop 应用程序的用户接口开发框架和SDK