Hbasesplit的过程以及解发条件(转)

作者：蛮小蛮将军_415 | 来源：互联网 | 2023-09-03 23:03

一、Split触发条件1、有任一一个Hfile的大小超过默认值10G时，都会进行split2、达到这个值不在拆分，默认为int_max，不进行拆分3、compaction时，如果c

一、Split触发条件

1、有任一一个Hfile的大小超过默认值10G时，都会进行split

2、达到这个值不在拆分，默认为int_max，不进行拆分

3、compaction时，如果compact的store的大小超过了，则进行split

4、 flush之前会检测区域中HStoreFile数目是否超过hbase.hstore.blockingStoreFiles，如果超过且没有等待超时会调用CompactSplitThread.requestSplit(HRegion)

5、 flush之后会调用HRegion.checkSplit()检测是否需要split，如果需要则调用CompactSplitThread.requestSplit(HRegion)

6、人工触发

二、Split过程

1、启动一个CompactSplitThresd线程

2、 SplitRequest.run

首先，实例化一个事务：在HDFS上的parent’s region 目录下创建一个.splits目录

其次，实例化两个RegionInfo: hri_a和 hri_b，赋予key的起始结束值，根据给定的splitkey

然后，执行execute方法：

（1）createDaughters

每个Reference文件管理原始文件一半的数据。Reference文件名字是一个ID，它使用被参考的Region的名字的Hash作为前缀。例如：1278437856009925445.3323223323。Reference文件只含有非常少量的信息，这些信息包括被分割的原始Region的Key以及这个文件管理前半段还是后半段。HBase使用HalfHFileReader类来访问Reference文件并从原始数据文件中读取数据

Offline parent in meta. 向.META.表Put Split的信息

（2）openDaughter--DaughterOpener-- DaughterOpener.run()--openDaughterRegion--openHRegion

openDaughter--postOpenDeployTasks

addToOnlineRegions // Should add it toOnlineRegions

（3） transitionZKNode :Finish off splittransaction, transition the zknode ，更新Split的状态 (之后由Master来处理,CatalogJanitor 来清理多余文件夹)

推荐阅读

header
Linux常用命令解析：ipcs与ipcrm

本文详细介绍了Linux系统中用于管理IPC（Inter-Process Communication）资源的两个重要命令：ipcs和ipcrm。通过这些命令，用户可以查看和删除系统中的消息队列、共享内存和信号量。 ... [详细]

蜡笔小新 2024-11-14 11:42:14
header
解决SQL Server数据库sa登录名无法连接的问题

在安装SQL Server数据库后，使用Windows身份验证成功，但使用SQL Server身份验证时遇到问题。本文将介绍如何通过设置sa登录名的密码、启用登录名状态以及开启TCP协议来解决这一问题。 ... [详细]

蜡笔小新 2024-11-14 10:15:02
text
SoundPool

如果应用程序经常播放密集、急促而又短暂的音效（如游戏音效）那么使用MediaPlayer显得有些不太适合了。因为MediaPlayer存在如下缺点：1)延时时间较长，且资源占用率高 ... [详细]

蜡笔小新 2024-11-13 16:47:19
text
自动验证时页面显示问题的解决方法

在使用自动验证功能时，页面未能正确显示错误信息。通过使用 `dump($info->getError())` 可以帮助诊断和解决问题。 ... [详细]

蜡笔小新 2024-11-13 12:30:21
text
解决DNS服务器配置转发无法解析的问题

本文详细介绍了如何解决DNS服务器配置转发无法解析的问题，包括编辑主配置文件和重启域名服务的具体步骤。 ... [详细]

蜡笔小新 2024-11-13 02:41:19
text
微软推出Windows Terminal Preview v0.10

微软近期发布了Windows Terminal Preview v0.10，用户可以在微软商店或GitHub上获取这一更新。该版本在2月份发布的v0.9基础上，新增了鼠标输入和复制Pane等功能。 ... [详细]

蜡笔小新 2024-11-12 16:15:56
text
Framework7：构建跨平台移动应用的高效框架

Framework7 是一个开源免费的框架，适用于开发混合移动应用（原生与HTML混合）或iOS&Android风格的Web应用。此外，它还可以作为原型开发工具，帮助开发者快速创建应用原型。 ... [详细]

蜡笔小新 2024-11-12 14:47:56
tree
开源数据库与数据结构算法

本文介绍了多种开源数据库及其核心数据结构和算法，包括MySQL的B+树、MVCC和WAL，MongoDB的tokuDB和cola，boltDB的追加仅树和mmap，levelDB的LSM树，以及内存缓存中的一致性哈希。 ... [详细]

蜡笔小新 2024-11-14 12:53:50
python
Python多线程详解与示例

本文介绍了Python中的多线程编程，包括僵尸进程和孤儿进程的概念，并提供了具体的代码示例。同时，详细解释了0号进程和1号进程在系统中的作用。 ... [详细]

蜡笔小新 2024-11-14 12:47:24
python
A*算法在AI路径规划中的应用

路径规划算法用于在地图上找到从起点到终点的最佳路径，特别是在存在障碍物的情况下。A*算法是一种高效且广泛使用的路径规划算法，适用于静态和动态环境。 ... [详细]

蜡笔小新 2024-11-14 10:53:20
select
NX二次开发：UFUN点收集器UF_UI_select_point_collection详解

本文介绍了如何在NX中使用UFUN库进行点收集器的二次开发，包括必要的头文件包含、初始化和选择点集合的具体实现。 ... [详细]

蜡笔小新 2024-11-14 10:18:35
python
Excel 数据分析基础

Excel 是数据分析中最基本且强大的工具之一，具备多种实用功能和操作方法。本文将简要介绍 Excel 的不同版本及其兼容性问题，并探讨在处理大数据时的替代方案。 ... [详细]

蜡笔小新 2024-11-14 07:39:50
python
数字资产交易平台量化交易系统开发

数字资产量化交易通过大数据分析，以客观的方式制定交易决策，有效减少人为的主观判断和情绪影响。本文介绍了几种常见的数字资产量化交易策略，包括搬砖套利和趋势交易，并探讨了量化交易软件的开发前景。 ... [详细]

蜡笔小新 2024-11-12 21:49:55
python
自定义滚动条美化页面内容

当页面内容超出显示范围时，为了提升用户体验和页面美观，通常会添加滚动条。如果默认的浏览器滚动条无法满足设计需求，我们可以自定义一个符合要求的滚动条。本文将详细介绍自定义滚动条的实现过程。 ... [详细]

蜡笔小新 2024-11-12 17:12:24
select
Pythonmysql数据库

importpymysql#一、直接连接mysql数据库'''coonpymysql.connect(host'192.168.*.*',u ... [详细]

蜡笔小新 2024-11-12 16:51:59

蛮小蛮将军_415

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章