Hadoop3.2.0Hadoop机架感知

作者：ik人生如梦场 | 来源：互联网 | 2024-10-10 15:26

Hadoop组件具有机架感知功能。例如，通过将一个块的分片放在不同的机架上，HDFS块放置将使用机架感知来实现容错。这可以在群集中发生网络切换故障或分区

Hadoop组件具有机架感知功能。例如&＃xff0c;通过将一个块的分片放在不同的机架上&＃xff0c;HDFS块放置将使用机架感知来实现容错。这可以在群集中发生网络切换故障或分区时提供数据可用性。

Hadoop主守护进程通过调用配置文件指定的外部脚本或java类来获取集群工作者的机架ID。使用java类或外部脚本进行拓扑&＃xff0c;输出必须遵循java org.apache.hadoop.net.DNSToSwitchMapping接口。接口需要保持一对一的对应关系&＃xff0c;并且拓扑信息的格式为&＃39;/ myrack/myhost&＃39;&＃xff0c;其中&＃39;/&＃39;是拓扑定界符&＃xff0c;&＃39;myrack&＃39;是机架标识符&＃xff0c;&＃39;myhost&＃39;是个人主持人。假设每个机架有一个/ 24个子网&＃xff0c;可以使用&＃39;/192.168.100.0/192.168.100.5&＃39;格式作为唯一的机架 - 主机拓扑映射。

要使用java类进行拓扑映射&＃xff0c;类名由配置文件中的net.topology.node.switch.mapping.impl参数指定。例如&＃xff0c;NetworkTopology.java包含在hadoop发行版中&＃xff0c;可以由Hadoop管理员自定义。使用Java类而不是外部脚本具有性能优势&＃xff0c;因为当新的工作节点注册自身时&＃xff0c;Hadoop不需要派生外部进程。

如果实现外部脚本&＃xff0c;将使用配置文件中的net.topology.script.file.name参数指定它。与java类不同&＃xff0c;外部拓扑脚本不包含在Hadoop发行版中&＃xff0c;由管理员提供。在分叉拓扑脚本时&＃xff0c;Hadoop将向ARGV发送多个IP地址。发送到拓扑脚本的IP地址数由net.topology.script.number.args控制&＃xff0c;默认为100.如果net.topology.script.number.args更改为1&＃xff0c;则每个拓扑脚本都会分叉DataNodes和/或NodeManagers提交的IP。

如果未设置net.topology.script.file.name或net.topology.node.switch.mapping.impl&＃xff0c;则会为任何传递的IP地址返回机架ID&＃39;/ default-rack&＃39;。虽然这种行为似乎是可取的&＃xff0c;但它可能会导致HDFS块复制出现问题&＃xff0c;因为默认行为是将一个复制块写入机架而无法执行此操作&＃xff0c;因为只有一个名为“/ default-rack”的机架。

python Example

#!/usr/bin/python # this script makes assumptions about the physical environment. # 1) each rack is its own layer 3 network with a /24 subnet, which # could be typical where each rack has its own # switch with uplinks to a central core router. # # &＃43;-----------&＃43; # |core router| # &＃43;-----------&＃43; # / \ # &＃43;-----------&＃43; &＃43;-----------&＃43; # |rack switch| |rack switch| # &＃43;-----------&＃43; &＃43;-----------&＃43; # | data node | | data node | # &＃43;-----------&＃43; &＃43;-----------&＃43; # | data node | | data node | # &＃43;-----------&＃43; &＃43;-----------&＃43; # # 2) topology script gets list of IP&＃39;s as input, calculates network address, and prints &＃39;/network_address/ip&＃39;.import netaddr import sys sys.argv.pop(0) # discard name of topology script from argv list as we just want IP addressesnetmask &＃61; &＃39;255.255.255.0&＃39; # set netmask to what&＃39;s being used in your environment. The example uses a /24for ip in sys.argv: # loop over list of datanode IP&＃39;saddress &＃61; &＃39;{0}/{1}&＃39;.format(ip, netmask) # format address string so it looks like &＃39;ip/netmask&＃39; to make netaddr worktry:network_address &＃61; netaddr.IPNetwork(address).network # calculate and print network addressprint "/{0}".format(network_address)except:print "/rack-unknown" # print catch-all value if unable to calculate network address

bash Example

#!/usr/bin/env bash # Here&＃39;s a bash example to show just how simple these scripts can be # Assuming we have flat network with everything on a single switch, we can fake a rack topology. # This could occur in a lab environment where we have limited nodes,like 2-8 physical machines on a unmanaged switch. # This may also apply to multiple virtual machines running on the same physical hardware. # The number of machines isn&＃39;t important, but that we are trying to fake a network topology when there isn&＃39;t one. # # &＃43;----------&＃43; &＃43;--------&＃43; # |jobtracker| |datanode| # &＃43;----------&＃43; &＃43;--------&＃43; # \ / # &＃43;--------&＃43; &＃43;--------&＃43; &＃43;--------&＃43; # |datanode|--| switch |--|datanode| # &＃43;--------&＃43; &＃43;--------&＃43; &＃43;--------&＃43; # / \ # &＃43;--------&＃43; &＃43;--------&＃43; # |datanode| |namenode| # &＃43;--------&＃43; &＃43;--------&＃43; # # With this network topology, we are treating each host as a rack. This is being done by taking the last octet # in the datanode&＃39;s IP and prepending it with the word &＃39;/rack-&＃39;. The advantage for doing this is so HDFS # can create its &＃39;off-rack&＃39; block copy. # 1) &＃39;echo $&＃64;&＃39; will echo all ARGV values to xargs. # 2) &＃39;xargs&＃39; will enforce that we print a single argv value per line # 3) &＃39;awk&＃39; will split fields on dots and append the last field to the string &＃39;/rack-&＃39;. If awk # fails to split on four dots, it will still print &＃39;/rack-&＃39; last field valueecho $&＃64; | xargs -n 1 | awk -F &＃39;.&＃39; &＃39;{print "/rack-"$NF}&＃39;

原文链接: https://hadoop.apache.org/docs/r3.2.0/

推荐阅读

int
Python配置文件读写指南

本文详细介绍如何使用Python进行配置文件的读写操作，涵盖常见的配置文件格式（如INI、JSON、TOML和YAML），并提供具体的代码示例。 ... [详细]

蜡笔小新 2024-12-28 08:39:55
int
UNP 第9章：主机名与地址转换

本章探讨了用于在主机名和数值地址之间进行转换的函数，如gethostbyname和gethostbyaddr。此外，还介绍了getservbyname和getservbyport函数，用于在服务器名和端口号之间进行转换。 ... [详细]

蜡笔小新 2024-12-27 11:26:39
int
golang常用库：配置文件解析库/管理工具viper使用

golang常用库：配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库，是由大神SteveFrancia开发，他在google领导着golang的 ... [详细]

蜡笔小新 2024-12-28 13:47:52
int
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
int
HDFS与Hive中的数据存储和管理机制

本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射，详细解释了两者的创建、加载及删除操作，并提供了查看表详细信息的方法。通过对比这两种表类型，帮助读者理解如何更好地管理和保护数据。 ... [详细]

蜡笔小新 2024-12-27 20:21:48
int
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
int
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
int
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
int
深入解析网络存储技术

本文详细介绍了网络存储技术的基本概念、分类及应用场景。通过分析直连式存储（DAS）、网络附加存储（NAS）和存储区域网络（SAN）的特点，帮助读者理解不同存储方式的优势与局限性。 ... [详细]

蜡笔小新 2024-12-24 10:38:34
int
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
int
Go语言基础：Hello World 实践

本文将介绍如何使用 Go 语言编写和运行一个简单的“Hello, World!”程序。内容涵盖开发环境配置、代码结构解析及执行步骤。 ... [详细]

蜡笔小新 2024-12-27 21:29:35
int
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
import
深入理解Tornado模板系统

本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块，支持嵌入Python代码片段，帮助开发者快速构建动态网页。 ... [详细]

蜡笔小新 2024-12-27 19:22:16
int
深入剖析电子邮件系统的安全漏洞及防范措施

随着网络安全威胁的不断演变，电子邮件系统成为攻击者频繁利用的目标。本文详细探讨了电子邮件系统中的常见漏洞及其潜在风险，并提供了专业的防护建议。 ... [详细]

蜡笔小新 2024-12-25 17:59:04
input
优化局域网SSH连接延迟问题的解决方案

本文介绍了解决局域网内SSH连接到服务器时出现长时间等待问题的方法。通过调整配置和优化网络设置，可以显著缩短SSH连接的时间。 ... [详细]

蜡笔小新 2024-12-25 11:31:48

ik人生如梦场

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章