当前位置: 开发笔记 > 编程语言 > 正文

大数据Hadoop生态(8)HDFS的读写数据流程以及机架感知

作者：yukiyu227232 | 来源：互联网 | 2023-10-10 10:54

1.HDFS的写数据流程1.客户端通过fs模块向NameNode申请文件上传,NameNode检查请求是否合法,如用户权限,目标文件是否已存在,父目录是否存在等等2.NameNod

1. HDFS的写数据流程

技术分享图片

1.客户端通过fs模块向NameNode申请文件上传,NameNode检查请求是否合法,如用户权限,目标文件是否已存在,父目录是否存在等等

2.NameNode返回是否可以上传,如果是的话,建立连接通道

3.客户端通过FSDataOutputStream模块请求上传block,NameNode根据网络拓扑距离计算返回的节点,dn1,dn2,dn3

4.客户端与dn1建立连接通道,dn1收到请求后会向dn2发起连接请求,dn2收到请求后会向dn3发起请求.请求通道全部打通后,会从后逐次向前应答,最后应答到客户端,通道建立成功

5.客户端开始上传block,block以packet为单位进行传输,大小为64k,dn1接收到packet后,将packet放入buffer缓冲中,一边往本地磁盘写,一边发送给dn2,dn2接收到后,以同样的方式进行处理和传输给dn3,dn3也进行同样的处理

6.等到block发送完毕后,本次传输结束

2.HDFS的读数据流程

技术分享图片

1. 客户端向NameNode申请文件下载,NameNode检查请求的合法性.如果请求合法,返回可以下载的相应,建立连接通道

2. 客户端请求下载文件,NameNode查询元数据,返回DataNode节点,DataNode节点以拓扑距离排序

3. 客户端请求连接第一个DataNode,应答成功后,DataNode开始以Packet传输数据.

4. 客户端接收Packet,边接收边写入磁盘.

5. 文件传输完成,关闭连接.

3.机架感知

技术分享图片

通常情况下,如果有三份备份(replication)的话,HDFS的策略是第一个replication在客户端所处的节点上,如果客户端在集群外,从拓扑网络的距离近的节点上随机选一个,第二个replication和第一个replication是同一机架上随机的节点.第三个replication是不同机架上随机的节点

大数据-Hadoop生态(8)-HDFS的读写数据流程以及机架感知

推荐阅读

random
为何Compose与Swarm之后仍有Kubernetes的诞生？

探讨在已有Compose和Swarm的情况下，Kubernetes是如何以其独特的设计理念和技术优势脱颖而出，成为容器编排领域的领航者。 ... [详细]

蜡笔小新 2024-11-22 09:26:11
io
深入解析Unity3D游戏开发中的音频播放技术

在游戏开发中，音频播放是提升玩家沉浸感的关键因素之一。本文将探讨如何在Unity3D中高效地管理和播放不同类型的游戏音频，包括背景音乐和效果音效，并介绍实现这些功能的具体步骤。 ... [详细]

蜡笔小新 2024-11-22 21:05:22
io
CentOS 服务器自定义密码策略

随着Linux操作系统的广泛使用，确保用户账户及系统安全变得尤为重要。用户密码的复杂性直接关系到系统的整体安全性。本文将详细介绍如何在CentOS服务器上自定义密码规则，以增强系统的安全性。 ... [详细]

蜡笔小新 2024-11-22 19:15:42
io
如何将 Git 提交编辑器从 Nano 更改为 Vim

默认情况下，Git 使用 Nano 编辑器进行提交信息的编辑，但如果您更喜欢使用 Vim，可以通过简单的配置更改来实现这一变化。本文将指导您如何通过修改全局配置文件来设置 Vim 作为默认的 Git 提交编辑器。 ... [详细]

蜡笔小新 2024-11-22 14:08:35
io
在Notepad++中配置Markdown语法高亮及实时预览功能

本文详细介绍了如何在Notepad++中配置Markdown语法高亮和实时预览功能，包括必要的插件安装和设置步骤。 ... [详细]

蜡笔小新 2024-11-22 13:03:49
io
解决映射文件中重复属性字段问题

探讨如何在映射文件中处理重复的属性字段，以避免数据操作时出现错误。 ... [详细]

蜡笔小新 2024-11-22 11:48:50
io
网络流24题——试题库问题

题目描述：假设一个试题库中有n道试题。每道试题都标明了所属类别。同一道题可能有多个类别属性。现要从题库中抽取m道题组成试卷。并要求试卷包含指定类型的试题。试设计一个满足要求的组卷算 ... [详细]

蜡笔小新 2024-11-22 11:33:55
io
深入理解C++中的自定义String类实现

本文探讨了一种常见的C++面试题目——实现自己的String类。通过此过程，不仅能够检验开发者对C++基础知识的掌握程度，还能加深对其高级特性的理解。文章详细介绍了如何实现基本的功能，如构造函数、析构函数、拷贝构造函数及赋值运算符重载等。 ... [详细]

蜡笔小新 2024-11-22 19:21:22
io
3DSMAX制作超现实的体育馆模型

这篇教程是向脚本之家的朋友介绍3DSMAX制作超现实的体育馆模型方法，教程制作出来的体育馆模型非常地不错，不过教程有点难度，需要有一定基础的朋友学习，推荐到脚本之家，喜欢的朋友可 ... [详细]

蜡笔小新 2024-11-22 16:07:10
controller
AngularJS中ng-repeat元素的单选功能实现

本文介绍了如何在AngularJS应用中使用ng-repeat指令创建可单独点击选中的列表项，并详细描述了实现这一功能的具体步骤和代码示例。 ... [详细]

蜡笔小新 2024-11-22 15:56:12
controller
冲刺最后一天的任务完成情况

在项目冲刺的最后一天，团队专注于软件用户界面的细节优化，包括调整控件布局和字体设置，以确保界面的简洁性和用户友好性。 ... [详细]

蜡笔小新 2024-11-22 14:51:19
controller
JavaScript 页面卸载事件详解 (onunload)

当用户从页面离开时（如关闭页面或刷新页面），会触发 onunload 事件，此时可以执行预设的脚本。需要注意的是，不同的浏览器对 onunload 事件的支持程度可能有所不同。 ... [详细]

蜡笔小新 2024-11-22 14:17:44
controller
探索Java 11中的ZGC垃圾收集器

Java 11引入了一种新的垃圾收集器——ZGC，由Oracle公司研发，旨在支持TB级别的内存容量，并保证极低的暂停时间。本文将探讨ZGC的开发背景、技术特点及其潜在的应用前景。 ... [详细]

蜡笔小新 2024-11-22 13:36:53
sum
HDU 6116 路径计数优化

本文探讨了使用普通生成函数和指数生成函数解决组合与排列问题的方法，特别是在处理特定路径计数问题时的应用。文章通过详细分析和代码实现，展示了如何高效地计算在给定条件下不相邻相同元素的排列数量。 ... [详细]

蜡笔小新 2024-11-22 13:11:20
sum
利用无代码平台实现高效业务应用开发

随着市场环境的变化加速，全球企业都在探索更为敏捷的应用开发模式，以便快速响应新兴的商业机遇。然而，传统的软件开发方式不仅成本高昂，而且耗时较长，这往往导致IT与业务部门之间的合作障碍，进而影响项目的成功。本文将探讨如何通过无代码开发平台解决这些问题。 ... [详细]

蜡笔小新 2024-11-22 11:09:21

yukiyu227232

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章