hbaseFilter

作者：优优绿园之时尚饰品_834 | 来源：互联网 | 2023-09-24 10:06

官网68.ClientRequestFilters介绍Filter本文基于版本hbase-1.1.2一、首先介绍几个知识点1.1、过滤器是作用于ScanorGet,通过设置Fi

官网68. Client Request Filters介绍Filter

本文基于版本hbase-1.1.2

在这里插入图片描述

一、首先介绍几个知识点

1.1、过滤器是作用于`Scan or Get`, 通过设置Filter&＃xff0c;对查询进行优化

Get and Scan instances can be optionally configured with filters which are applied on the RegionServer. Filters can be confusing because there are many different types, and it is best to approach them by understanding the groups of Filter functionality.

1.2、FilterList 过滤器集合&＃xff0c; 可以设置多个Filter&＃xff0c; 通过FilterList

下面参数设置Filter生效策略

FilterList.Operator.MUST_PASS_ONE 表示or的关系&＃xff0c; 有一个Filter符合就可以
FilterList.Operator.MUST_PASS_ALL 便是and关系&＃xff0c; 都匹配上。

1.3、`org.apache.hadoop.hbase.filter.CompareFilter`&＃xff0c; Filter的高层抽闲类&＃xff0c; 提供两点

operator (equal, greater, not equal, etc) , 定义在 enum CompareOp中

/** Comparison operators. */&＃64;InterfaceAudience.Public&＃64;InterfaceStability.Stablepublic enum CompareOp {/** less than */LESS,/** less than or equal to */LESS_OR_EQUAL,/** equals */EQUAL,/** not equal */NOT_EQUAL,/** greater than or equal to */GREATER_OR_EQUAL,/** greater than */GREATER,/** no operation */NO_OP,}

comparator &＃xff0c; 它的类型是ByteArrayComparable一个抽象类&＃xff0c; 通过ctrl&＃43;t可以看到它的子类。

这里写图片描述

##上面连个参数是所有Filter都需要的。
##二、过滤器可以根据过滤类型进行分组
###2.1、过滤Column Value
###2.1.1、SingleColumnValueFilter

SingleColumnValueFilter singleColumnValueFilter&＃61; new SingleColumnValueFilter("cf1".getBytes(), //column family"data".getBytes(), //columnCompareOp.EQUAL, new SubstringComparator("223.73.39.213"));/comparator: 匹配子串

###2.1.2、ColumnValueFilter(这个是2.0.0才引入的&＃xff0c; 作为SingeColumnValueFilter的补充)

###2.2、 KeyValue Metadata

由于HBASE内部存储数据是按照键值对的&＃xff0c;KeyValue Metadata Filters 评估行的keys(i.e., ColumnFamily:Column qualifiers)的存在性&＃xff0c;而不是前一节的值。
###2.2.1、FamilyFilter
###2.2.2、QualifierFilter
###2.2.3、ColumnPrefixFilter
###2.2.4、MultipleColumnPrefixFilter
###2.2.5、ColumnRangeFilter

###2.3、根据rowkey过滤
通常使用StROTW/STOPROW方法来扫描行选择是更好的想法&＃xff0c;但是也可以使用RowFilter。
###2.3.1、RowFilter

RowFilter rowFilter &＃61; new RowFilter(CompareOp.EQUAL, new RegexStringComparator(reg));//两个基本参数

####RowKey的后缀匹配实现&＃xff1a; 例如ROWKEY是yyyyMMDD-UserID形式&＃xff0c;如果要以UserID为条件查询数据&＃xff0c;怎样实现&＃xff1f;

筛选出某一userId在一个时间段[time1,time2)的值
####解决&＃xff1a; 结合startrow, endrow, rowfilter

scan &＃39;tablename&＃39; {STARTROW&＃61;>&＃39;time1&＃43;uid&＃39;, ENDROW&＃61;>&＃39;time2&＃43;uid&＃39;, FILTER&＃61;>"RowFilter(&＃61;,&＃39;regexstring:.*uid&＃39;)"}

####代码中实现

Scan scan &＃61; new Scan(); scan.setStartRow(Bytes.toBytes(time1&＃43;uid)); scan.setStopRow(Bytes.toBytes(time2&＃43;uid)); Filter filter &＃61; new RowFilter(CompareFilter.CompareOp.EQUAL,new RegexStringComparator(".*"&＃43;uid)); scan.setFilter(filter);ResultScanner rs &＃61; null; HTable table &＃61; new HTable(hbaseConfig, Bytes.toBytes(tableName)); String rowkey &＃61; null; rs &＃61; table.getScanner(scan); for (Result r : rs) {for (KeyValue kv : r.list()) {rowkey &＃61; Bytes.toString(kv.getRow());System.out.println(rowkey);} }

###2.4、Utility
###2.4.1、FirstKeyOnlyFilter
This is primarily used for rowcount jobs.

推荐阅读

io
如何使用 `org.apache.tomcat.websocket.server.WsServerContainer.findMapping()` 方法及其代码示例解析

如何使用 `org.apache.tomcat.websocket.server.WsServerContainer.findMapping()` 方法及其代码示例解析 ... [详细]

蜡笔小新 2024-11-11 10:08:55
sum
com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例

com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 10:47:33
list
CentOS 7 中配置开机自动挂载 NFS 的解决方案

本文详细介绍了在 CentOS 7 系统中配置 fstab 文件以实现开机自动挂载 NFS 共享目录的方法，并解决了常见的配置失败问题。 ... [详细]

蜡笔小新 2024-11-13 12:05:24
import
Spring Boot 中配置全局文件上传路径并实现文件上传功能

本文介绍如何在 Spring Boot 项目中配置全局文件上传路径，并通过读取配置项实现文件上传功能。通过这种方式，可以更好地管理和维护文件路径。 ... [详细]

蜡笔小新 2024-11-13 11:19:38
io
利用Struts1构建简易计算器：采用DispatchAction处理请求，动态Form优化开发流程，提供用户友好的错误提示

本文介绍了如何利用Struts1框架构建一个简易的四则运算计算器。通过采用DispatchAction来处理不同类型的计算请求，并使用动态Form来优化开发流程，确保代码的简洁性和可维护性。同时，系统提供了用户友好的错误提示，以增强用户体验。 ... [详细]

蜡笔小新 2024-11-09 19:48:22
list
Java DAO模式详解与代码示例

DAO（Data Access Object）模式是一种用于抽象和封装所有对数据库或其他持久化机制访问的方法，它通过提供一个统一的接口来隐藏底层数据访问的复杂性。 ... [详细]

蜡笔小新 2024-11-13 12:25:33
list
如何在Java中使用DButils类

这期内容当中小编将会给大家带来有关如何在Java中使用DButils类，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。D ... [详细]

蜡笔小新 2024-11-12 13:46:11
python
解决 Ubuntu 下 Samba 重新安装时配置文件未重新生成的问题

在 Ubuntu 中遇到 Samba 服务器故障时，尝试卸载并重新安装 Samba 发现配置文件未重新生成。本文介绍了解决该问题的方法。 ... [详细]

蜡笔小新 2024-11-12 13:02:23
list
JavaWeb文件上传：前端实现与后端处理详解

在JavaWeb开发中，文件上传是一个常见的需求。无论是通过表单还是其他方式上传文件，都必须使用POST请求。前端部分通常采用HTML表单来实现文件选择和提交功能。后端则利用Apache Commons FileUpload库来处理上传的文件，该库提供了强大的文件解析和存储能力，能够高效地处理各种文件类型。此外，为了提高系统的安全性和稳定性，还需要对上传文件的大小、格式等进行严格的校验和限制。 ... [详细]

蜡笔小新 2024-11-11 19:50:46
python
大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式

大类|电阻器_使用Requests、Etree、BeautifulSoup、Pandas和Path库进行数据抓取与处理 | 将指定区域内容保存为HTML和Excel格式 ... [详细]

蜡笔小新 2024-11-11 19:05:59
list
在PHP中如何正确调用JavaScript变量及定义PHP变量的方法详解

在PHP中如何正确调用JavaScript变量及定义PHP变量的方法详解 ... [详细]

蜡笔小新 2024-11-11 17:28:29
install
在Linux系统中避免安装MySQL的简易指南

在Linux系统中避免安装MySQL的简易指南 ... [详细]

蜡笔小新 2024-11-11 13:22:28
join
Keepalived VIP 漂移故障分析与解决

在分析和解决 Keepalived VIP 漂移故障的过程中，我们发现主备节点配置如下：主节点 IP 为 172.16.30.31，备份节点 IP 为 172.16.30.32，虚拟 IP 为 172.16.30.10。故障表现为监控系统显示 Keepalived 主节点状态异常，导致 VIP 漂移到备份节点。通过详细检查配置文件和日志，我们发现主节点上的 Keepalived 进程未能正常运行，最终通过优化配置和重启服务解决了该问题。此外，我们还增加了健康检查机制，以提高系统的稳定性和可靠性。 ... [详细]

蜡笔小新 2024-11-11 09:31:14
list
自定义 Android 圆形进度条视图，支持显示数字和中心文字

本文介绍了一种自定义的Android圆形进度条视图，支持在进度条上显示数字，并在圆心位置展示文字内容。通过自定义绘图和组件组合的方式实现，详细展示了自定义View的开发流程和关键技术点。示例代码和效果展示将在文章末尾提供。 ... [详细]

蜡笔小新 2024-11-10 13:04:42
list
解决Android EditText中TextWatcher的onTextChanged方法频繁触发问题

【问题】在Android开发中，当为EditText添加TextWatcher并实现onTextChanged方法时，会遇到一个问题：即使只对EditText进行一次修改（例如使用删除键删除一个字符），该方法也会被频繁触发。这不仅影响性能，还可能导致逻辑错误。本文将探讨这一问题的原因，并提供有效的解决方案，包括使用Handler或计时器来限制方法的调用频率，以及通过自定义TextWatcher来优化事件处理，从而提高应用的稳定性和用户体验。 ... [详细]

蜡笔小新 2024-11-10 12:50:42

优优绿园之时尚饰品_834

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

hbaseFilter

一、首先介绍几个知识点

1.1、 过滤器是作用于Scan or Get, 通过设置Filter&＃xff0c;对查询进行优化

1.2、FilterList 过滤器集合&＃xff0c; 可以设置多个Filter&＃xff0c; 通过FilterList

1.3、org.apache.hadoop.hbase.filter.CompareFilter&＃xff0c; Filter的高层抽闲类&＃xff0c; 提供两点

1.1、过滤器是作用于`Scan or Get`, 通过设置Filter&＃xff0c;对查询进行优化

1.3、`org.apache.hadoop.hbase.filter.CompareFilter`&＃xff0c; Filter的高层抽闲类&＃xff0c; 提供两点