当前位置: 开发笔记 > 运维 > 正文

HbaseFamilyFilter

作者：爱lovely壮壮_366 | 来源：互联网 | 2018-06-11 03:32

FamilyFilter用于过滤Familypackagecom.fatkun.filter;importjava.io.IOException;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.HBaseConfiguration;importorg.apache.hadoop.hbase.HColumnDescriptor;importorg.apac

FamilyFilter 用于过滤Family package com.fatkun.filter;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop.hbase.HColumnDescriptor;import org.apac

FamilyFilter 用于过滤Family

package com.fatkun.filter;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.hbase.HBaseConfiguration;
import org.apache.hadoop.hbase.HColumnDescriptor;
import org.apache.hadoop.hbase.HTableDescriptor;
import org.apache.hadoop.hbase.client.Get;
import org.apache.hadoop.hbase.client.HBaseAdmin;
import org.apache.hadoop.hbase.client.HTable;
import org.apache.hadoop.hbase.client.Put;
import org.apache.hadoop.hbase.client.Result;
import org.apache.hadoop.hbase.client.ResultScanner;
import org.apache.hadoop.hbase.client.Scan;
import org.apache.hadoop.hbase.filter.BinaryComparator;
import org.apache.hadoop.hbase.filter.CompareFilter;
import org.apache.hadoop.hbase.filter.FamilyFilter;
import org.apache.hadoop.hbase.filter.Filter;
import org.apache.hadoop.hbase.util.Bytes;
public class TestHbaseFamilyFilter &＃123;
	String tableName = "test_family_filter";
	Configuration cOnfig= HBaseConfiguration.create&＃40;&＃41;;
	/**
	 * 部分代码来自hbase权威指南
	 * @throws IOException
	 */
	public void testRowFilter&＃40;&＃41; throws IOException &＃123;
		HTable table = new HTable&＃40;config, tableName&＃41;;
		Scan scan = new Scan&＃40;&＃41;;
		System.out.println&＃40;"只列出小于data2的列"&＃41;;
		Filter filter1 = new FamilyFilter&＃40;CompareFilter.CompareOp.LESS, 
			      new BinaryComparator&＃40;Bytes.toBytes&＃40;"data2"&＃41;&＃41;&＃41;;
		scan.setFilter&＃40;filter1&＃41;;
		ResultScanner scanner1 = table.getScanner&＃40;scan&＃41;;
		for &＃40;Result res : scanner1&＃41; &＃123;
			System.out.println&＃40;res&＃41;;
		&＃125;
		scanner1.close&＃40;&＃41;;
		System.out.println&＃40;"get也可以设置filter"&＃41;;
		Get get1 = new Get&＃40;Bytes.toBytes&＃40;"row005"&＃41;&＃41;;
	    get1.setFilter&＃40;filter1&＃41;;
	    Result result1 = table.get&＃40;get1&＃41;; 
	    System.out.println&＃40;"Result of get(): " + result1&＃41;;
	&＃125;
	/**
	 * 初始化数据
	 */
	public void init&＃40;&＃41; &＃123;
		// 创建表和初始化数据
		try &＃123;
			HBaseAdmin admin = new HBaseAdmin&＃40;config&＃41;;
			if &＃40;!admin.tableExists&＃40;tableName&＃41;&＃41; &＃123;
				HTableDescriptor htd = new HTableDescriptor&＃40;tableName&＃41;;
				HColumnDescriptor hcd1 = new HColumnDescriptor&＃40;"data1"&＃41;;
				htd.addFamily&＃40;hcd1&＃41;;
				HColumnDescriptor hcd2 = new HColumnDescriptor&＃40;"data2"&＃41;;
				htd.addFamily&＃40;hcd2&＃41;;
				HColumnDescriptor hcd3 = new HColumnDescriptor&＃40;"data3"&＃41;;
				htd.addFamily&＃40;hcd3&＃41;;
				admin.createTable&＃40;htd&＃41;;
			&＃125;
			HTable table = new HTable&＃40;config, tableName&＃41;;
			table.setAutoFlush&＃40;false&＃41;;
			int count = 50;
			for &＃40;int i = 1; i <= count; ++i&＃41; &＃123;
				Put p = new Put&＃40;String.format&＃40;"row%03d", i&＃41;.getBytes&＃40;&＃41;&＃41;;
				p.add&＃40;"data1".getBytes&＃40;&＃41;, String.format&＃40;"col%01d", i % 10&＃41;
						.getBytes&＃40;&＃41;, String.format&＃40;"data1%03d", i&＃41;.getBytes&＃40;&＃41;&＃41;;
				p.add&＃40;"data2".getBytes&＃40;&＃41;, String.format&＃40;"col%01d", i % 10&＃41;
						.getBytes&＃40;&＃41;, String.format&＃40;"data2%03d", i&＃41;.getBytes&＃40;&＃41;&＃41;;
				p.add&＃40;"data3".getBytes&＃40;&＃41;, String.format&＃40;"col%01d", i % 10&＃41;
						.getBytes&＃40;&＃41;, String.format&＃40;"data3%03d", i&＃41;.getBytes&＃40;&＃41;&＃41;;
				table.put&＃40;p&＃41;;
			&＃125;
			table.close&＃40;&＃41;;
		&＃125; catch &＃40;IOException e&＃41; &＃123;
			e.printStackTrace&＃40;&＃41;;
		&＃125;
	&＃125;
	/**
	 * @param args
	 * @throws IOException
	 */
	public static void main&＃40;String&＃91;&＃93; args&＃41; throws IOException &＃123;
		TestHbaseFamilyFilter test = new TestHbaseFamilyFilter&＃40;&＃41;;
		test.init&＃40;&＃41;;
		test.testRowFilter&＃40;&＃41;;
	&＃125;
&＃125;

原文地址：Hbase FamilyFilter, 感谢原作者分享。

推荐阅读

hadoop
HBase 数据复制与灾备同步策略

本文探讨了HBase在企业级应用中的数据复制与灾备同步解决方案，包括存量数据迁移及增量数据实时同步的方法。 ... [详细]

蜡笔小新 2024-11-21 19:20:03
容器
探索阿里巴巴的开源世界

从理想主义者的内心深处萌发的技术信仰，推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]

蜡笔小新 2024-11-21 09:06:54
容器
精选10款Python框架助力并行与分布式机器学习

随着神经网络模型的不断深化和复杂化，训练这些模型变得愈发具有挑战性，不仅需要处理大量的权重，还必须克服内存限制等问题。本文将介绍10款优秀的Python框架，帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]

蜡笔小新 2024-11-20 19:44:05
容器
流处理中的计数挑战与解决方案

本文探讨了在流处理中进行计数的各种技术和挑战，并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性，还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]

蜡笔小新 2024-11-20 13:50:01
容器
解析与应用：org.apache.hadoop.hdfs.server.namenode.FSNamesystem.shouldUseDelegationTokens() 方法

本文详细介绍了 `org.apache.hadoop.hdfs.server.namenode.FSNamesystem.shouldUseDelegationTokens()` 方法的用途和实际应用场景，并提供了多个代码示例以帮助开发者更好地理解和使用该方法。 ... [详细]

蜡笔小新 2024-11-18 17:59:10
容器
MapReduce 中的输入输出格式控制

本文介绍了如何在 MapReduce 作业中使用 SequenceFileOutputFormat 生成 SequenceFile 文件，并详细解释了 SequenceFile 的结构和用途。 ... [详细]

蜡笔小新 2024-11-17 14:43:42
容器
Hadoop Datanode DataXceiver 错误处理问题

Ambari 每分钟会向 Datanode 发送一次“ping”请求以确保其正常运行。然而，Datanode 在处理空内容时没有相应的逻辑，导致出现错误。 ... [详细]

蜡笔小新 2024-11-16 21:12:43
linux
日志处理流程：Flume+MapReduce+Hive+Sqoop+MySQL

本文介绍了如何使用Flume从Linux文件系统收集日志并存储到HDFS，然后通过MapReduce清洗数据，使用Hive进行数据分析，并最终通过Sqoop将结果导出到MySQL数据库。 ... [详细]

蜡笔小新 2024-11-13 18:47:34
负载均衡
大厂Java研发岗位面试总结与资料分享

本文总结了一次针对大厂Java研发岗位的面试经历，探讨了面试中常见的问题及其背后的原因，并分享了一些实用的面试准备资料。 ... [详细]

蜡笔小新 2024-11-20 19:00:01
shell
Android与JUnit集成测试实践

本文探讨了如何在Android项目中集成JUnit进行单元测试，并详细介绍了修改AndroidManifest.xml文件以支持测试的方法。 ... [详细]

蜡笔小新 2024-11-20 18:30:14
nginx
Windows环境下Apache频繁崩溃的解决方案

本文探讨了在Windows系统中运行Apache服务器时频繁出现崩溃的问题，并提供了多种可能的解决方案和建议。错误日志显示多个子进程因达到最大请求限制而退出。 ... [详细]

蜡笔小新 2024-11-20 13:07:27
linux
innodb 索引设计小结

一关于t1表和testtb的索引设计二把主键放到二级索引的后面，会否占据更多的物理空间？三InnoDB的主键该如何选择，业务ID和自增 ... [详细]

蜡笔小新 2024-11-16 15:11:20
linux
Hadoop 架构详解：核心组件解析

本文介绍了Hadoop的核心组件，包括高可靠性和高吞吐量的分布式文件系统HDFS、分布式的离线并行计算框架MapReduce、作业调度与集群资源管理框架YARN以及支持其他模块的工具模块Common。 ... [详细]

蜡笔小新 2024-11-16 12:13:59
linux
大数据领域的职业路径与角色解析

本文将深入探讨大数据领域的各种职业和工作角色，帮助读者全面了解大数据行业的需求、市场趋势，以及从入门到高级专业人士的职业发展路径。文章还将详细介绍不同公司对大数据人才的需求，并解析各岗位的具体职责、所需技能和经验。 ... [详细]

蜡笔小新 2024-11-16 08:54:03
容器
Java 容器学习笔记

通过马老师的视频学习了Java中的容器相关内容，包括Collection、Set、List、Map及其常见实现类，并深入了解了这些容器的基本操作方法。 ... [详细]

蜡笔小新 2024-11-15 08:31:19

爱lovely壮壮_366

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章