作者:柯洁豪雅伯育瑋 | 来源:互联网 | 2023-05-18 11:20
一、CCAHAdministratorHadoop管理员认证认证准备建议:Hadoop管理员培训考试形式:90分钟;70%通过;60道多项选择题(会提示是单选or多选)培训
一、CCAH Administrator Hadoop管理员认证
认证准备建议:Hadoop管理员培训
考试形式:90分钟;70%通过;60道多项选择题(会提示是单选or多选)
培训内容
通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:
Cloudera Manager管理机群的特性,譬如日志汇总、配置管理、报告、报警及服务管理。 YARN、MapReduce、Spark及HDFS的工作原理。
如何为你的机群选取合适的硬件和架构。
如何将 Hadoop 机群和企业已有的系统进行无缝集成。
如何使用Flume 进行实时数据采集以及如何使用Sqoop在RDBMS和Hadoop机群之间进行数据导入导出。
如何配置公平调度器为Hadoop上的多用户提供服务级别保障。
产品环境中Hadoop机群的最佳运维实践。
Hadoop机群排错、诊断问题和性能调优。
培训对象及学员基础
“面向系统管理员和IT 经理,需具备Linux 经验,无需Apache Hadoop 基础。
认证 “结束本课程培训后,我们建议学员准备并注册参加Cloudera 认证 Hadoop 管理员考试(CCAH)。通过并获取该证书是向公司及客户证明个人在Hadoop 领域的技术和专长的有力依据。
二、CCA Spark and Hadoop Developer开发者认证
认证准备建议:Spark andHadoop开发者培训
考试形式:120分钟;70%通过;解决10~12基于CDH5机群上需通过实际操作的问题
培训内容
通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:
在 Hadoop 机群上进行分布式存储和处理数据。
在 Hadoop 机群上编写、配置和部署 Apache Spark 应用。
使用 Spark shell 进行交互式数据分析。
使用 Spark SQL 查询处理结构化数据。
使用 Spark Streaming 处理流式数据。
使用 Flume 和 Kafka 为 Spark Streaming 采集流式数据。
培训对象及学员基础
本课程适合于具有编程经验的开发员及工程师。无需 Apache Hadoop 基础,培训内容中对 Apache Spark 的介绍所涉及的代码及练习使用 Scala 和Python,因此需至少掌握这两个编程语言中的一种。需熟练掌握 Linux 命令行。对 SQL 有基本了解。
三、CCA Data Analyst数据分析师认证
认证准备建议:DataAnalyst数据分析师培训
考试形式:120分钟;70%通过;解决10~12个客户问题,对于每一个问题,考生必须给出一个满足所有要求的精确的技术解决方案。考生可在群集上使用任何工具或组合使用工具。
培训内容
通过讲师在课堂上的讲解,以及实操练习,学员将熟悉Hadoop生态系统, 学习主题包括:
Pig、Hive 和 Impala 针对数据采集、存储和分析而提供的功能。
Apache Hadoop的基本原理,以及使用Hadoop工具进行数据ETL(提取、
转换和加载)、撷取和处理。
Pig、Hive 和 Impala 是如何提高典型分析任务的处理效率的。
联接多种多样的数据集,以获得有价值的商业洞察力。
执行实时、复杂的数据集查询。
培训对象和学员基础
本课程是专为数据分析师、商业智能专家、开发人员、系统架构师和数据库管理员开发的。培训学员需具备一定的SQL知识水平,且基本熟悉 Linux 命令行。培训学员至少熟悉一种脚本语言知识(例如,Bash 脚本编程、 Perl、Python和 Ruby)将会更有帮助,但不是必需的。此外,培训学员不需要具备Apache Hadoop知识。