当前位置: 开发笔记 > 编程语言 > 正文

5.Hbase配置文件详解（一）

作者：非机动车地了 | 来源：互联网 | 2023-08-23 15:13

1.hbase.tmp.dir描述本地文件系统上的临时目录。将此设置更改为指向比’tmp’更永久的位置，这是java.io.tmpdir的常用解决方案，因为’tmp’目录在机器重启

1. hbase.tmp.dir

描述

本地文件系统上的临时目录。将此设置更改为指向比&＃8217;/ tmp&＃8217;更永久的位置，这是java.io.tmpdir的常用解决方案，因为&＃8217;/ tmp&＃8217;目录在机器重启时被清除。

默认

${java.io.tmpdir}/hbase-${user.name}

2. hbase.rootdir

描述

区域服务器共享的目录以及HBase持久存在的目录。URL应该是“完全限定的”以包含文件系统方案。例如，要在端口9000上的namenode.example.org上指定HDFS实例的namenode运行的HDFS目录“/ hbase”，请将此值设置为：hdfs：//namenode.example.org：9000 / hbase。默认情况下，我们写入也设置了$ {hbase.tmp.dir} &＃8211; 通常是/ tmp &＃8211; 所以更改此配置，否则所有数据将在机器重启时丢失。

默认

${hbase.tmp.dir}/hbase

3. hbase.cluster.distributed

描述

集群部署模式。独立模式的可能值为false，分布式模式的值为true。如果为false，则启动将在一个JVM中一起运行所有HBase和ZooKeeper守护程序。

默认

false

4. hbase.zookeeper.quorum

描述

逗号分隔的ZooKeeper集合中的服务器列表（此配置应该已命名为hbase.zookeeper.ensemble）。例如，“host1.mydomain.com，host2.mydomain.com，host3.mydomain.com”。默认情况下，对于本地和伪分布式操作模式，将其设置为localhost。对于完全分布式设置，应将其设置为ZooKeeper集合服务器的完整列表。如果在hbase-env.sh中设置了HBASE_MANAGES_ZK，则这是hbase将作为集群启动/停止的一部分启动/停止ZooKeeper的服务器列表。在客户端，我们将获取这个集合成员列表并将其与hbase.zookeeper.property.clientPort配置放在一起。并将其作为connectString参数传递给zookeeper构造函数。

默认

localhost

5. zookeeper.recovery.retry.maxsleeptime

描述

在以毫秒为单位重试zookeeper操作之前的最长休眠时间，此处需要最长时间，以便睡眠时间不会无限增长。

默认

60000

6. hbase.local.dir

描述

本地文件系统上的目录，用作本地存储。

默认

${hbase.tmp.dir}/local/

7. hbase.master.port

描述

HBase Master应该绑定的端口。

默认

16000

8. hbase.master.info.port

描述

HBase Master Web UI的端口。如果您不想运行UI实例，请设置为-1。

默认

16010

9. hbase.master.info.bindAddress

描述

HBase Master Web UI的绑定地址。

默认

0.0.0.0

10. hbase.master.logcleaner.plugins

描述

由LogsCleaner服务调用的BaseLogCleanerDelegate的逗号分隔列表。这些WAL清理是按顺序调用的。要实现您自己的BaseLogCleanerDelegate，只需将其放入HBase的类路径中，并在此添加完全限定的类名。始终在列表中添加上面的默认日志清理工具。

默认

org.apache.hadoop.hbase.master.cleaner.TimeToLiveLogCleaner,org.apache.hadoop.hbase.master.cleaner.TimeToLiveProcedureWALCleaner

11. hbase.master.logcleaner.ttl

描述

WAL在归档（{hbase.rootdir} / oldWALs）目录中保留多久，之后将由主线程清除。该值以毫秒为单位。

默认

600000

12. hbase.master.procedurewalcleaner.ttl

描述

程序WAL将在归档目录中保留多久，之后将由主线程清除。该值以毫秒为单位。

默认

604800000

13. hbase.master.hfilecleaner.plugins

描述

由HFileCleaner服务调用的BaseHFileCleanerDelegate的逗号分隔列表。这些HFile清理器按顺序调用。要实现您自己的BaseHFileCleanerDelegate，只需将其放入HBase的类路径中，并在此添加完全限定的类名。总是在列表中添加上面的默认日志清除程序，因为它们将被覆盖在hbase-site.xml中。

默认

org.apache.hadoop.hbase.master.cleaner.TimeToLiveHFileCleaner

14. hbase.master.infoserver.redirect

描述

Master是否侦听Master Web UI端口（hbase.master.info.port）并将请求重定向到Master和RegionServer共享的Web UI服务器。当Master对Regions（非默认）提供服务时配置才有意义。

默认

true

15. hbase.master.fileSplitTimeout

描述

Split Region 时文件拆分的超时时间。默认值：600000。此设置曾在hbase-1.x中称为hbase.regionserver.fileSplitTimeout。Split 现在运行master端，因此重命名为此。（如果找到&＃8217;hbase.master.fileSplitTimeout&＃8217;设置，将优先使用它作为当前&＃8217;hbase.master.fileSplitTimeout&＃8217;配置。

默认

600000

16. hbase.regionserver.port

描述

HBase RegionServer绑定的端口。

默认

16020

17. hbase.regionserver.info.port

描述

HBase RegionServer Web UI 的端口如果不希望RegionServer UI 运行，请设置为-1。

默认

16030

18. hbase.regionserver.info.bindAddress

描述

HBase RegionServer Web UI的地址

默认

0.0.0.0

19. hbase.regionserver.info.port.auto

描述

Master或RegionServer UI是否应搜索要绑定的端口。如果hbase.regionserver.info.port 已在使用中，则启用自动端口搜索。用于测试，默认情况下关闭。

默认

false

20. hbase.regionserver.handler.count

描述

在RegionServers上启动的RPC侦听器实例的数量。Master 使用相同的属性来设置主处理程序的数量。太多的处理程序可能适得其反。设置其为CPU数量的倍数。如果大多数需求是只读型的，那么将处理程序数设置为接近cpu计数效果明显。从CPU计数的两倍开始进行左右调整。

默认

30

21. hbase.ipc.server.callqueue.handler.factor

描述

确定呼叫队列数的因素。值0表示在所有处理程序之间共享的单个队列。值为1表示每个处理程序都有自己的队列。

默认

0.1

22. hbase.ipc.server.callqueue.read.ratio

描述

将呼叫队列拆分为读写队列。指定的间隔（应介于0.0和1.0之间）将乘以调用队列的数量。值为0表示不拆分调用队列，这意味着读取和写入请求都将被推送到同一组队列。低于0.5的值意味着读取队列将少于写入队列。值为0.5表示将有相同数量的读写队列。大于0.5的值意味着将有比写入队列更多的读取队列。值1.0表示除了一个队列之外的所有队列都用于分派读取请求。示例：如果调用队列的总数为10，则read.ratio为0意味着：10个队列将包含两个读/写请求。read.ratio为0.3意味着：3个队列仅包含读取请求，7个队列仅包含写入请求。read.ratio为0.5意味着：5个队列仅包含读取请求，5个队列仅包含写入请求。read.ratio为0.8意味着：8个队列仅包含读取请求，2个队列仅包含写入请求。read.ratio为1意味着：9个队列仅包含读取请求，1个队列仅包含写入请求。

默认

0

23. hbase.ipc.server.callqueue.scan.ratio

描述

给定读取调用队列的数量，根据调用队列的总数乘以callqueue.read.ratio计算，scan.ratio属性将读取调用队列分成小读取和长读取队列。低于0.5的值意味着长读取队列的数量将少于短读取队列。值为0.5意味着将有相同数量的短读取和长读取队列。大于0.5的值意味着将有比长读取队列更多的长读取队列值0或1表示使用相同的队列集进行获取和扫描。示例：如果读取队列的总数为8，则scan.ratio为0或1表示：8个队列将包含长读取请求和短读取请求。scan.ratio为0.3意味着：2个队列只包含长读请求，6个队列只包含短读请求。scan.ratio为0.5意味着：4个队列只包含长读请求，4个队列只包含短读请求。scan.ratio为0.8意味着：6个队列只包含长读请求，2个队列只包含短读请求。

默认

0

24. hbase.regionserver.msginterval

描述

消息从RegionServer到Master之间的间隔（以毫秒为单位）。

默认

3000

25. hbase.regionserver.logroll.period

描述

无论edits日志有多少，我们都将滚动提交日志的时间段。

默认

3600000

26. hbase.regionserver.logroll.errors.tolerated

描述

在触发服务器中止之前我们将允许的连续WAL关闭错误的数量。如果在日志滚动期间关闭当前WAL编写器失败，将此值设置为0将导致区域服务器中止。即使较小的值（2或3）region server 也将跃过 HDFS错误。

默认

2

27. hbase.regionserver.hlog.reader.impl

描述

WAL文件阅读器实现。

默认

org.apache.hadoop.hbase.regionserver.wal.ProtobufLogReader

28. hbase.regionserver.hlog.writer.impl

描述

WAL文件编写器实现。

默认

org.apache.hadoop.hbase.regionserver.wal.ProtobufLogWriter

29. hbase.regionserver.global.memstore.size

描述

在新的更新被阻止并强制Flush之前，regionserver 中所有 memstore 的最大大小。默认为堆的40％（0.4）。直到regionserver 中所有memstore 的大小达到hbase.regionserver.global.memstore.size.lower.limit，更新将被阻止并强制Flush。此配置中的默认值特意设置为none，以便遵守旧的hbase.regionserver.global.memstore.upperLimit 属性（如果存在）。

默认

none

30. hbase.regionserver.global.memstore.size.lower.limit

描述

强制刷新之前regionserver中所有memstore的最大大小。默认为hbase.regionserver.global.memstore.size（0.95）的95％。当由于memstore限制而阻止更新时，此值的100％值会导致最小可能的刷新。此配置中的默认值有意留空，以便遵守旧的hbase.regionserver.global.memstore.lowerLimit属性（如果存在）。

默认

none

推荐阅读

web
深入解析NoSQL数据库：键值对、文档、列式存储与图数据库的应用与特点

本文深入探讨了NoSQL数据库的四大主要类型：键值对存储、文档存储、列式存储和图数据库。NoSQL（Not Only SQL）是指一系列非关系型数据库系统，它们不依赖于固定模式的数据存储方式，能够灵活处理大规模、高并发的数据需求。键值对存储适用于简单的数据结构；文档存储支持复杂的数据对象；列式存储优化了大数据量的读写性能；而图数据库则擅长处理复杂的关系网络。每种类型的NoSQL数据库都有其独特的优势和应用场景，本文将详细分析它们的特点及应用实例。 ... [详细]

蜡笔小新 2024-11-09 14:47:28
php
从0到1搭建大数据平台

从0到1搭建大数据平台 ... [详细]

蜡笔小新 2024-11-12 15:26:03
regex
Java 网站开发指南

本文详细介绍了 Java 网站开发的相关资源和步骤，包括常用网站、开发环境和框架选择。 ... [详细]

蜡笔小新 2024-11-14 22:39:58
spring
微服务优雅上下线的最佳实践

本文介绍了微服务上下线的正确姿势，避免使用 kill -9 等粗暴手段，确保服务的稳定性和可靠性。 ... [详细]

蜡笔小新 2024-11-14 16:22:57
ip
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
php
探讨HTTP隧道技术在RDP暴力破解中的应用

本文介绍了如何利用HTTP隧道技术在受限网络环境中绕过IDS和防火墙等安全设备，实现RDP端口的暴力破解攻击。文章详细描述了部署过程、攻击实施及流量分析，旨在提升网络安全意识。 ... [详细]

蜡笔小新 2024-11-12 12:08:47
format
使用Shell脚本高效部署MHA高可用集群

本文介绍了如何利用Shell脚本高效地部署MHA（MySQL High Availability）高可用集群。通过详细的脚本编写和配置示例，展示了自动化部署过程中的关键步骤和注意事项。该方法不仅简化了集群的部署流程，还提高了系统的稳定性和可用性。 ... [详细]

蜡笔小新 2024-11-10 10:15:46
ip
Java Socket 关键参数详解与优化建议

Java Socket 的 API 虽然被广泛使用，但其关键参数的用途却鲜为人知。本文详细解析了 Java Socket 中的重要参数，如 backlog 参数，它用于控制服务器等待连接请求的队列长度。此外，还探讨了其他参数如 SO_TIMEOUT、SO_REUSEADDR 等的配置方法及其对性能的影响，并提供了优化建议，帮助开发者提升网络通信的稳定性和效率。 ... [详细]

蜡笔小新 2024-11-09 21:38:05
spring
Bootstrap 学习指南：全面掌握前端框架的核心知识点与实战技巧

### 优化后的摘要本学习指南旨在帮助读者全面掌握 Bootstrap 前端框架的核心知识点与实战技巧。内容涵盖基础入门、核心功能和高级应用。第一章通过一个简单的“Hello World”示例，介绍 Bootstrap 的基本用法和快速上手方法。第二章深入探讨 Bootstrap 与 JSP 集成的细节，揭示两者结合的优势和应用场景。第三章则进一步讲解 Bootstrap 的高级特性，如响应式设计和组件定制，为开发者提供全方位的技术支持。 ... [详细]

蜡笔小新 2024-11-09 16:58:21
include
ESP8266 01S Web 服务器成功启动：详细解决方案与实践指南

本文详细介绍了一种利用 ESP8266 01S 模块构建 Web 服务器的成功实践方案。通过具体的代码示例和详细的步骤说明，帮助读者快速掌握该模块的使用方法。在疫情期间，作者重新审视并研究了这一未被充分利用的模块，最终成功实现了 Web 服务器的功能。本文不仅提供了完整的代码实现，还涵盖了调试过程中遇到的常见问题及其解决方法，为初学者提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-08 19:12:49
web
Cosmos生态系统为何迅速崛起，波卡作为跨链巨头应如何应对挑战？

Cosmos生态系统为何迅速崛起，波卡作为跨链巨头应如何应对挑战？ ... [详细]

蜡笔小新 2024-11-08 09:25:06
php
第二章：Kafka基础入门与核心概念解析

本章节主要介绍了Kafka的基本概念及其核心特性。Kafka是一种分布式消息发布和订阅系统，以其卓越的性能和高吞吐量而著称。最初，Kafka被设计用于LinkedIn的活动流和运营数据处理，旨在高效地管理和传输大规模的数据流。这些数据主要包括用户活动记录、系统日志和其他实时信息。通过深入解析Kafka的设计原理和应用场景，读者将能够更好地理解其在现代大数据架构中的重要地位。 ... [详细]

蜡笔小新 2024-11-06 11:10:03
format
如何安全地手动移除Exchange Server 2003以确保系统稳定性和数据完整性

本文详细介绍了如何安全地手动卸载Exchange Server 2003，以确保系统的稳定性和数据的完整性。根据微软官方支持文档（https://support.microsoft.com/kb833396/zh-cn），在进行卸载操作前，需要特别注意备份重要数据，并遵循一系列严格的步骤，以避免对现有网络环境造成不利影响。此外，文章还提供了详细的故障排除指南，帮助管理员在遇到问题时能够迅速解决，确保整个卸载过程顺利进行。 ... [详细]

蜡笔小新 2024-11-06 08:13:47
ip
Hadoop 2.6 日志文件解析与MapReduce日志管理深入探讨

Hadoop 2.6 主要由 HDFS 和 YARN 两大部分组成，其中 YARN 包含了运行在 ResourceManager 的 JVM 中的组件以及在 NodeManager 中运行的部分。本文深入探讨了 Hadoop 2.6 日志文件的解析方法，并详细介绍了 MapReduce 日志管理的最佳实践，旨在帮助用户更好地理解和优化日志处理流程，提高系统运维效率。 ... [详细]

蜡笔小新 2024-11-03 16:23:38
text
构建高可用性Spark分布式集群：大数据环境下的最佳实践

在构建高可用性的Spark分布式集群过程中，确保所有节点之间的无密码登录是至关重要的一步。通过在每个节点上生成SSH密钥对（使用 `ssh-keygen -t rsa` 命令并保持默认设置），可以实现这一目标。此外，还需将生成的公钥分发到所有节点的 `~/.ssh/authorized_keys` 文件中，以确保节点间的无缝通信。为了进一步提升集群的稳定性和性能，建议采用负载均衡和故障恢复机制，并定期进行系统监控和维护。 ... [详细]

蜡笔小新 2024-11-02 14:18:50

非机动车地了

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章