HDFS基础知识与数据读写机制详解

作者：北人南漂记 | 来源：互联网 | 2024-10-30 11:58

本文详细介绍了HDFS的基础知识及其数据读写机制。首先，文章阐述了HDFS的架构，包括其核心组件及其角色和功能。特别地，对NameNode进行了深入解析，指出其主要负责在内存中存储元数据、目录结构以及文件块的映射关系，并通过持久化方案确保数据的可靠性和高可用性。此外，还探讨了DataNode的角色及其在数据存储和读取过程中的关键作用。

1&＃xff1a;架构

2&＃xff1a;角色功能

2.1&＃xff1a;Namenode

完全基于内存存储元数据、目录结构、文件block的映射
需要持久化方案来保证数据可靠性
提供副本放置策略

2.2&＃xff1a;Datandode

基于本地磁盘存储block(文件的形式)
并保存block的校验和数据&＃xff0c;保证block的可靠性
与NameNode保持心跳&＃xff0c;汇报block列表状态

注意&＃xff1a;

一个文件上传完后块的大小不能改变&＃xff0c;但是副本数可以改变
阿里的推荐&＃xff1a;一个集群最好不要超过5k台–网络通信会不好管
往内存放的存储组件&＃xff1a;hbase、namenode、elasticsearch、redis&＃xff1b;这些都需要持久化- 方案保存数据可靠性
hdfs并没有帮我们存数据&＃xff0c;而是起到一个管理映射的作用
block的校验和是用来算文件是否完整&＃xff0c;是否被破坏

3&＃xff1a;元数据的持久化

任何对HDFS元数据产生修改的操作&＃xff0c;NameNode都会使用一种称为EditLog的事务日志记录下来
使用FSImage存储内存所有的元数据状态
使用本地磁盘保存EditLog和FSImage
EditLog具有完整性&＃xff0c;数据丢失少&＃xff0c;但恢复速度慢&＃xff0c;并有体积膨胀风险
FSImage具有恢复速度快&＃xff0c;体积与内存数据相当&＃xff0c;但不能实时保存&＃xff0c;数据丢失多
NameNode使用了FSImage&＃43;Editlog整合的方案&＃xff1b;滚动的将增量的EditLog更新到FSImage,以保证更近时点的FSImage和更小的EditLog体积

问题

那么&＃xff0c;FSImage时点是怎么滚动更新的&＃xff01;&＃xff1f;

如果由NN&＃xff0c;8点溢写&＃xff0c;9点溢写。。。。太耗NN的CPU/IO了

寻求办法就是找一台机子来做 -----SNN&＃xff08;SecondaryNameNode&＃xff09;

4&＃xff1a;安全模式

NN存元数据有文件的属性、每个块存在哪个DN上

在持久化的时候&＃xff0c;文件属性会持久化&＃xff0c;但是文件的每一个块位置信息不会持久化 &＃xff0c;如果持久化了的话&＃xff0c;下次服务重启恢复数据的时候&＃xff0c;DN挂掉就会造成块的位置信息错误&＃xff0c;从而丢失数据。那么应该怎么办呢&＃xff1f;

分布式时代讲究的就是数据一致性&＃xff01;&＃xff01;

NN会等&＃xff0c;等DN&＃xff0c;因为DN会与他建立心跳&＃xff0c;汇报块信息&＃xff01;&＃xff01;从而保证块位置信息等是最新的&＃xff0c;这个等的过程NN会进入安全模式

NN启动后会进入一个称为安全模式的特殊状态
处于安全模式的NN是不会进行数据块的复制的
NN从所有DN接受心跳信号和块状态报告
每当NN检测确认某个block的副本数目达到这个最小值&＃xff0c;那么该数据块就会被认为是副本安全的&＃xff08;safely replicated&＃xff09;
在一定百分比&＃xff08;参数可配置&＃xff09;的数据块被NN检测确认安全之后&＃xff08;加上一个额外的30s等待时间&＃xff09;&＃xff0c;NN就会退出安全模式
接下来NN会确定哪些数据块的副本没有达到指定数目&＃xff0c;并将这些数据块复制到其他的DN上

5&＃xff1a;SecondaryNameNode

在非HA模式下&＃xff0c;SNN一般是独立的节点&＃xff0c;周期完成对NN的EL向FI合并&＃xff0c;减少EL大小&＃xff0c;减少NN启动时间
根据配置文件设置的时间间隔fs.checkpoint.period默认3600秒
根据配置文件设置EL的大小fs.checkpoint.size&＃xff0c;规定EL文件的最大默认值为64M

他的出现解决了3中的问题&＃xff01;

6&＃xff1a;副本放置策略

Hadoop2.x中放置策略如下

第二个副本放在与第一个副本不同机架中的服务器上&＃xff0c;&＃xff08;而Hadoop1.x中第二个副本默认放在第一个副本同机架上了&＃xff0c;2.x为了防止副本数为2而导致副本丢失的情况&＃xff0c;特意将第二个机架做如此调整&＃xff09;

第三个副本放在与第二个副本在一块的机架下

因为在同一个交换机中&＃xff0c;网速快。

放在其他机架&＃xff0c;就会有网络资源消耗

7&＃xff1a;写流程

如下图是某一时间点&＃xff0c;客户端在传某一文件的一个块的三个副本的时刻

Client和NN连接创建文件元数据
NN会判定元数据是否有效&＃xff0c;比如文件目录是否存在等等
NN给Client发送副本放置策略&＃xff0c;返回一个有序的DN列表
Client跟DN通信&＃xff0c;建立PipeLine连接
Client将块切分成packet&＃xff08;64KB&＃xff09;&＃xff0c;并使用chunk&＃xff08;512B&＃xff09;&＃43;chunksum&＃xff08;4B&＃xff09;填充
Client将packet放入发送队列dataqueue中&＃xff0c;并向第一个DN发送
第一个DN收到packet后本地保存并发送给第二个DN
第二个DN收到packet后本地保存并发送给第三个DN
这一过程中&＃xff0c;上游节点同时发送下一个packet
生活中类比工厂的流水线&＃xff0c;结论:流式其实也是变种的并行计算
HDFS用这种传输方式&＃xff0c;副本数对于Client是透明的
当block传输完成&＃xff0c;DN们各自向NN汇报&＃xff0c;同事Clietn继续传输下一个block
所以Client的传输和block块的汇报也是并行的

Client跟DN通信&＃xff0c;建立PipeLine连接

8&＃xff1a;读流程

为了降低整体的带款消耗和读取延时&＃xff0c;HDFS会尽量让读取程序读取离他最近的副本
如果在读取程序的同一个机架上有一个副本&＃xff0c;那么就读取该副本
如果一个HDFS集群跨越多个数据中心&＃xff0c;那么客户端也将首先读取本地数据中心的数据
语义&＃xff1a;下载一个文件&＃xff1a;

- Client 和NN交互文件元数据信息来获取fileBlockLocation

- NN会按距离策略排序返回

- Client尝试下载block并校验数据完整性

语义&＃xff1a;下载一个文件其实是获取文件的所有block元数据&＃xff0c;那么获取某些block也应该成立的&＃xff08;是子集操作&＃xff09;

- HDFS支持Client输出文件的offset自定义连接哪些block的DN&＃xff0c;自定义来获取某些数据

- 这个是支持计算层的分治思想&＃xff0c;并行计算的核心

————————————————

原文链接&＃xff1a;https://blog.csdn.net/qq_37865420/article/details/106364463

已得到原博主转载允许

推荐阅读

config
Dockerfile 编写与 Docker 网络配置详解

本文详细介绍了 Dockerfile 的编写方法及其在网络配置中的应用，涵盖基础指令、镜像构建与发布流程，并深入探讨了 Docker 的默认网络、容器互联及自定义网络的实现。 ... [详细]

蜡笔小新 2024-12-27 17:31:41
config
MySQL缓存机制深度解析

本文详细探讨了MySQL的缓存机制，包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术，读者可以更好地优化数据库性能。 ... [详细]

蜡笔小新 2024-12-26 15:15:06
input
Hadoop入门与核心组件详解

本文详细介绍了Hadoop的基础知识及其核心组件，包括HDFS、MapReduce和YARN。通过本文，读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]

蜡笔小新 2024-12-26 13:12:48
input
Spring Cloud学习指南：深入理解微服务架构

本文介绍了微服务架构的基本概念及其在Spring Cloud中的实现。讨论了微服务架构的主要优势，如简化开发和维护、快速启动、灵活的技术栈选择以及按需扩展的能力。同时，也探讨了微服务架构面临的挑战，包括较高的运维要求、分布式系统的复杂性、接口调整的成本等问题。最后，文章提出了实施微服务时应遵循的设计原则。 ... [详细]

蜡笔小新 2024-12-19 09:25:36
web
MySQL架构在大规模应用中的进化路径

本文探讨了随着并发需求的增长，MySQL数据库架构如何从简单的单一实例发展到复杂的分布式系统，以及每一步演进背后的原理和技术解决方案。 ... [详细]

蜡笔小新 2024-12-16 09:00:35
web
58同城的Elasticsearch应用与平台构建实践

本文由58同城高级架构师于伯伟分享，由陈树昌编辑整理，内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用，特别是在58同城的实施案例，包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]

蜡笔小新 2024-12-11 19:31:21
web
构建高性能Feed流系统的设计指南

随着移动互联网的发展，Feed流系统成为了众多社交应用的核心组成部分。本文将深入探讨如何设计一个高效、稳定的Feed流系统，涵盖从基础架构到高级特性的各个方面。 ... [详细]

蜡笔小新 2024-11-26 12:55:53
import
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
import
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
get
深入探讨CPU虚拟化与KVM内存管理

本文详细介绍了现代服务器架构中的CPU虚拟化技术，包括SMP、NUMA和MPP三种多处理器结构，并深入探讨了KVM的内存虚拟化机制。通过对比不同架构的特点和应用场景，帮助读者理解如何选择最适合的架构以优化性能。 ... [详细]

蜡笔小新 2024-12-25 19:15:51
get
科研单位信息系统中的DevOps实践与优化

本文探讨了某科研单位通过引入云原生平台实现DevOps开发和运维一体化，显著提升了项目交付效率和产品质量。详细介绍了如何在实际项目中应用DevOps理念，解决了传统开发模式下的诸多痛点。 ... [详细]

蜡笔小新 2024-12-24 11:46:45
config
Spring Boot单元测试中Redis连接失败的解决方案

本文探讨了在Spring Boot项目中进行单元测试时遇到Redis连接问题的原因及解决方法，详细分析了配置文件加载路径不当导致的问题，并提供了有效的解决方案。 ... [详细]

蜡笔小新 2024-12-22 16:14:00
python
优化Flask应用的并发处理：解决Mysql连接过多问题

本文探讨了在Flask应用中通过优化后端架构来应对高并发请求，特别是针对Mysql 'too many connections' 错误的解决方案。我们将介绍如何利用Redis缓存、Gunicorn多进程和Celery异步任务队列来提升系统的性能和稳定性。 ... [详细]

蜡笔小新 2024-12-21 09:21:49
string
Apache ZooKeeper 中 FileTxnLog.setPreallocSize 方法详解与应用实例

本文详细介绍了 Apache ZooKeeper 的 FileTxnLog 类中的 setPreallocSize 方法，并提供了多个实际应用中的代码示例。通过这些示例，读者可以更好地理解如何在不同场景下合理设置日志文件的预分配大小。 ... [详细]

蜡笔小新 2024-12-05 13:52:17
string
时序数据库的应用与设计策略

时序数据是指按时间顺序排列的数据集。通过时间轴上的数据点连接，可以构建多维度报表，揭示数据的趋势、规律及异常情况。 ... [详细]

蜡笔小新 2024-11-26 17:30:42

北人南漂记

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章