当前位置: 开发笔记 > 编程语言 > 正文

【Hadoop离线基础总结】Hadoop的架构模型

作者：幸福的妈妈88 | 来源：互联网 | 2023-08-26 19:25

Hadoop的架构模型

1.x的版本架构模型介绍

架构图
HDFS分布式文件存储系统（典型的主从架构）
NameNode：集群当中的主节点，主要用于维护集群当中的元数据信息，以及接受用户的请求，处理用户的请求
SecondaryNameNode：主要是辅助NameNode管理元数据信息
DataNode：集群当中的从节点，主要用于存储数据
什么是元数据？
元数据就是描述数据的数据。简单的来说，一个文件的存放位置、文件名称、打开方式、创建人、修改时间、文件大小、文件权限等这些都是描述性的数据，都可以称为元数据。拿到现实生活中来说，判断一个人是否是我们想要找到的人，他的样貌、身高、体型、穿着这些都是描述性的信息，也就是元数据。
mapReduce分布式计算系统
JobTracker：主节点，接受用户请求，分配任务给taskTracker去执行
TaskTracker：从节点，主要用于接受jobTracker分配的任务

2.x的版本架构模型介绍

第一种：NameNode和ResourceManager单节点架构模型

HDFS文件存储系统（典型的主从架构）
NameNode：集群当中的主节点，主要用于维护集群当中的元数据信息，以及接受用户的请求，处理用户的请求
SecondaryNameNode：主要是辅助NameNode管理元数据信息
DataNode：集群当中的从节点，主要用于存储数据

Yarn资源调度系统
ResourceManager：主节点，接受用户请求，分配资源（分配CPU、分配内存等）
NodeManager：从节点，主要用于处理计算任务

第二种：NameNode单节点和ResourceManager高可用架构模型
第三种：NameNode高可用和ResourceManager单节点架构模型

NameNode高可用
NameNode Active：处于活跃的主节点，处理用户请求，维护元数据信息
NameNode StandBy：处于待命的节点，当活跃的主节点出故障停止工作后，切换为活跃的主节点，对外提供服务
JournalNode：专门用于同步元数据信息（因为，如果NameNode高可用，就一定要保证两个NameNode的元数据信息一致，否则就会出现脑裂的问题。JournalNode机制就是用来解决这个问题的）
zkfc ( ZooKeeper FailLover Controller )：NameNode的守护进程，用于监听NameNode的状态，当NameNode Active出故障停机时，会立刻通知NameNode StandBy切换为活跃的主节点

第四种：NameNode高可用和ResourceManager高可用架构模型

推荐阅读

cpu
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
cpu
Hadoop源码解析1Hadoop工程包架构解析

1 Hadoop中各工程包依赖简述 Google的核心竞争技术是它的计算平台。Google的大牛们用了下面5篇文章，介绍了它们的计算设施。 GoogleCluster：ht ... [详细]

蜡笔小新 2023-10-17 13:28:20
cpu
伸缩性|发生_分布式文件系统设计，该从哪些方面考虑？

篇首语：本文由编程笔记#小编为大家整理，主要介绍了分布式文件系统设计，该从哪些方面考虑？相关的知识，希望对你有一定的参考价值。点击上方关注“ ... [详细]

蜡笔小新 2023-10-16 17:43:40
cpu
Hadoop之Yarn

目录1Hadoop1.x和Hadoop2.x架构区别2Yarn概述3Yarn基本架构4Yarn工作机制5作业提交全过程6资源调度器7任务的推测执行1Hadoop1.x和Hadoo ... [详细]

蜡笔小新 2023-10-15 12:16:30
cpu
什么是大数据lambda架构

一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出，根据维基百科的定义，Lambda架构的设计是为了在处理大规模数 ... [详细]

蜡笔小新 2023-10-17 16:06:09
input
mapreduce源码分析总结

这篇文章总结的非常到位,故而转之一MapReduce概述MapReduce是一个用于大规模数据处理的分布式计算模型，它最初是由Google工程师设计并实现的ÿ ... [详细]

蜡笔小新 2023-10-17 12:36:35
input
Hadoop学习笔记1：伪分布式环境搭建

在搭建Hadoop环境之前，请先阅读如下博文，把搭建Hadoop环境之前的准备工作做好，博文如下： 1、CentOS6.7下安装JDK,地址：http:b ... [详细]

蜡笔小新 2023-10-16 16:04:04
web
Oracle优化新常态的五大禁止及其性能隐患

本文介绍了Oracle优化新常态中的五大禁止措施，包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB，并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况，并提出了解决方案。 ... [详细]

蜡笔小新 2023-12-12 12:55:55
c语言
ejava,刘聪dejava

本文目录一览：1、什么是Java？2、java ... [详细]

蜡笔小新 2023-12-09 09:28:18
c语言
《Spark核心技术与高级应用》——1.2节Spark的重要扩展

本节书摘来自华章社区《Spark核心技术与高级应用》一书中的第1章，第1.2节Spark的重要扩展，作者于俊向海代其锋马海平，更多章节内容可以访问云栖社区“华章社区”公众号查看1. ... [详细]

蜡笔小新 2023-10-16 18:07:56
c语言
Kylin 单节点安装

软件环境Hadoop:2.7,3.1(sincev2.5)Hive:0.13-1.2.1HBase:1.1,2.0(sincev2.5)Spark(optional)2.3.0K ... [详细]

蜡笔小新 2023-10-16 16:09:42
get
Hadoop （CDH4发行版）集群部署（部署脚本，namenode高可用，hadoop管理）

前言折腾了一段时间hadoop的部署管理，写下此系列博客记录一下。为了避免各位做部署这种重复性的劳动，我已经把部署的步骤写成脚本，各位只需要按着本文把脚本执行完，整个环境基本就部署 ... [详细]

蜡笔小新 2023-10-16 15:11:51
get
hadoop基础----hadoop实战(六)-----hadoop管理工具---Cloudera Manager---CDH介绍

我们在之前的文章中已经初步介绍了Cloudera。hadoop基础----hadoop实战(零)-----hadoop的平台版本选择从版本选择这篇文章中我们了解到除了hadoop官方版本外很多 ... [详细]

蜡笔小新 2023-10-16 14:21:13
get
MapReduce工作流程最详细解释

MapReduce是我们再进行离线大数据处理的时候经常要使用的计算模型，MapReduce的计算过程被封装的很好，我们只用使用Map和Reduce函数，所以对其整体的计算过程不是太 ... [详细]

蜡笔小新 2023-10-16 14:14:27
command
YARN回顾（七）——Spark在YARN上的运行模式

SparkOnYarn在YARN上启动Spark应用有两种模式。在cluster模式下，Spark驱动器（driver）在YARNApp ... [详细]

蜡笔小新 2023-10-15 12:39:15

幸福的妈妈88

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章