hbase学习笔记

作者：幸福天使之宝贝 | 来源：互联网 | 2023-08-15 15:44

HBase–HadoopDatabase，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群。HBase

HBase简介

HBase – Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase利用Hadoop HDFS作为其文件存储系统，利用Hadoop MapReduce来处理HBase中的海量数据，利用Zookeeper作为协调工具

主键：Row Key

主键是用来检索记录的主键，访问hbase table中的行，只有三种方式

通过单个row key访问

通过row key的range

全表扫描

列族：Column Family

列族在创建表的时候声明，一个列族可以包含多个列，列中的数据都是以二进制形式存在，没有数据类型

时间戳：timestamp

HBase中通过row和columns确定的为一个存贮单元称为cell。每个 cell都保存着同一份数据的多个版本。版本通过时间戳来索引

HBASE基础知识

物理存储

Table 在行的方向上分割为多个HRegion，一个region由[startkey,endkey)表示，每个HRegion分散在不同的RegionServer中

技术分享

架构体系

i. Client 包含访问hbase 的接口，client 维护着一些cache 来加快对hbase 的访问，比如regione 的位置信息
ii. Zookeeper
1. 保证任何时候，集群中只有一个running master
2. 存贮所有Region 的寻址入口
3. 实时监控Region Server 的状态，将Region server 的上线和下线信息，实时通知给Master
4. 存储Hbase 的schema,包括有哪些table，每个table 有哪些column family
5. iii. Master 可以启动多个HMaster，通过Zookeeper的Master Election机制保证总有一个Master运行
  1. 为Region server 分配region
  2. 负责region server 的负载均衡
  3. 发现失效的region server 并重新分配其上的region

HBase中有两张特殊的Table，-ROOT-和.META.

-ROOT- ：记录了.META.表的Region信息，-ROOT-只有一个region

.META. ：记录了用户创建的表的Region信息，.META.可以有多个regoin

Zookeeper中记录了-ROOT-表的location

Client访问用户数据之前需要首先访问zookeeper，然后访问-ROOT-表，接着访问.META.表，最后才能找到用户数据的位置去访问

技术分享

Region Server

1、维护Master 分配给它的region，处理对这些region 的IO 请求

2、负责切分在运行过程中变得过大的region

可以看出，client 访问hbase 上数据的过程并不需要master 参与，寻址访问先zookeeper再regionserver，数据读写访问regioneserver。HRegionServer主要负责响应用户I/O请求，向HDFS文件系统中读写数据，是HBase中最核心的模块。

技术分享

Hbase表存储结构：

HBASE Shell的DDL操作

名称	命令表达式
创建表	create ‘表名称‘, ‘列族名称1‘,‘列族名称2‘,‘列族名称N‘
添加记录	put ‘表名称‘, ‘行名称‘, ‘列名称:‘, ‘值‘
查看记录	get ‘表名称‘, ‘行名称‘
查看表中的记录总数	count ‘表名称‘
删除记录	delete ‘表名‘ ,‘行名称‘ , ‘列名称‘
删除一张表	先要屏蔽该表，才能对该表进行删除，第一步 disable ‘表名称‘ 第二步 drop ‘表名称‘
查看所有记录	scan "表名称"
查看某个表某个列中所有数据	scan "表名称" , {COLUMNS=>‘列族名称:列名称‘}
更新记录	就是重写一遍进行覆盖

1、创建表

>create ‘users‘,‘user_id‘,‘address‘,‘info‘

表users,有三个列族user_id,address,info

2、列出全部表

>list

3、得到表的描述

>describe ‘users‘

4、创建表

>create ‘users_tmp‘,‘user_id‘,‘address‘,‘info‘

5、删除表

>disable ‘users_tmp‘

>drop ‘users_tmp‘

HBASE Shell的DML操作

1、添加记录

put ‘users‘,‘xiaoming‘,‘info:age‘,‘24‘;

put ‘users‘,‘xiaoming‘,‘info:birthday‘,‘1987-06-17‘;

put ‘users‘,‘xiaoming‘,‘info:company‘,‘alibaba‘;

2、获取一条记录

1.取得一个id的所有数据

>get ‘users‘,‘xiaoming‘

2.获取一个id，一个列族的所有数据

>get ‘users‘,‘xiaoming‘,‘info‘

3.获取一个id，一个列族中一个列的

所有数据

get ‘users‘,‘xiaoming‘,‘info:age‘

3、更新记录

>put ‘users‘,‘xiaoming‘,‘info:age‘ ,‘29‘

>get ‘users‘,‘xiaoming‘,‘info:age‘

>put ‘users‘,‘xiaoming‘,‘info:age‘ ,‘30‘

>get ‘users‘,‘xiaoming‘,‘info:age‘

4、获取单元格数据的版本数据

>get ‘users‘,‘xiaoming‘,{COLUMN=>‘info:age‘,VERSIOnS=>1}

>get ‘users‘,‘xiaoming‘,{COLUMN=>‘info:age‘,VERSIOnS=>2}

>get ‘users‘,‘xiaoming‘,{COLUMN=>‘info:age‘,VERSIOnS=>3}

5、获取单元格数据的某个版本数据

〉get ‘users‘,‘xiaoming‘,{COLUMN=>‘info:age‘,TIMESTAMP=>1364874937056}

6、全表扫描

>scan ‘users‘

HBASE的Java_API（一）

11.  import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.*;

import org.apache.hadoop.hbase.client.*;

import org.apache.hadoop.hbase.util.Bytes;

import org.jruby.RubyProcess;

import org.junit.Before;

import org.junit.Test;



import java.io.IOException;



/**

 * Created by Administrator on 2017/3/13.

 */

public class Application {



    private Configuration cOnf= null;



    @Before

    public void init(){

        cOnf= HBaseConfiguration.create();

        conf.set("hbase.zookeeper.quorum", "hadoop4:2181,hadoop5:2181,hadoop6:2181");



    }



    @Test

    public void testDrop() throws IOException {

        HBaseAdmin admin=new HBaseAdmin(conf);

        admin.disableTable("account");

        admin.deleteTable("account");

        admin.close();

    }



    @Test

    public void testPut() throws IOException {

        HTable table=new HTable(conf,"book");

        Put put =new Put(Bytes.toBytes("book0005"));

        put.add(Bytes.toBytes("dock1"),Bytes.toBytes("info"),Bytes.toBytes("liuyan"));

        table.put(put);

        table.close();

    }



    @Test

    public void testGet() throws IOException {

        HTable table =new HTable(conf,"book");

        Get get=new Get(Bytes.toBytes("book0001"));

        get.addColumn(Bytes.toBytes("dock1"),Bytes.toBytes("info"));

        get.addColumn(Bytes.toBytes("dock1"),Bytes.toBytes("isbn"));

        Result result=table.get(get);

        for (KeyValue kv: result.list()) {

            String family =new String( kv.getFamily());

            System.out.print(family);

            String clum=new String(kv.getQualifier());

            System.out.print(clum);

            System.out.print(new String(kv.getValue()));

        }

    }



    @Test

    public void testDel() throws IOException {

        HTable table=new HTable(conf,"book");

        Delete delete=new Delete(Bytes.toBytes("book0001"));

        delete.deleteColumn(Bytes.toBytes("dock1"),Bytes.toBytes("info"));

        table.delete(delete);

        table.close();

    }



    @Test

    public void testScan() throws IOException {

        HTablePool pool=new HTablePool(conf,10);

        HTableInterface hTableInterface=pool.getTable("book");

        Scan scan=new Scan(Bytes.toBytes("book0001"),Bytes.toBytes("book0005"));

        scan.addFamily(Bytes.toBytes("dock1"));

        ResultScanner results= hTableInterface.getScanner(scan);

        for (Result t : results){

            byte[]value=t.getValue(Bytes.toBytes("dock1"),Bytes.toBytes("isbn"));

            System.out.print(new String(value));

        }



    }



    public static void main(String[] args) throws IOException {

        Configuration cOnf= HBaseConfiguration.create();

        conf.set("hbase.zookeeper.quorum", "hadoop4:2181,hadoop5:2181,hadoop6:2181");

        HBaseAdmin admin = null;

        try {

            admin = new HBaseAdmin(conf);

        } catch (IOException e) {

            e.printStackTrace();

        }

        HTableDescriptor td = new HTableDescriptor(TableName.valueOf("htable"));

        HColumnDescriptor cd = new HColumnDescriptor("info");

        cd.setMaxVersions(10);

        td.addFamily(cd);



        admin.createTable(td);



        admin.close();



        // System.out.print("11111111111");

    }



}

hbase 学习笔记

推荐阅读

client
ABAP开发发送邮件程序的配置和代码整理

本文介绍了通过ABAP开发往外网发邮件的需求，并提供了配置和代码整理的资料。其中包括了配置SAP邮件服务器的步骤和ABAP写发送邮件代码的过程。通过RZ10配置参数和icm/server_port_1的设定，可以实现向Sap User和外部邮件发送邮件的功能。希望对需要的开发人员有帮助。摘要长度：184字。 ... [详细]

蜡笔小新 2023-12-13 15:50:17
merge
C#之数据集：DataSet对象的使用及相关方法详解

本文介绍了C#中数据集DataSet对象的使用及相关方法详解，包括DataSet对象的概述、与数据关系对象的互联、Rows集合和Columns集合的组成，以及DataSet对象常用的方法之一——Merge方法的使用。通过本文的阅读，读者可以了解到DataSet对象在C#中的重要性和使用方法。 ... [详细]

蜡笔小新 2023-12-14 12:09:13
jsp
Mac OS 升级到11.2.2 Eclipse打不开了，报错Failed to create the Java Virtual Machine

本文介绍了在Mac OS升级到11.2.2版本后，使用Eclipse打开时出现报错Failed to create the Java Virtual Machine的问题，并提供了解决方法。 ... [详细]

蜡笔小新 2023-12-14 12:01:13
jsp
Hibernate基础映射

在说Hibernate映射前，我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象，以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]

蜡笔小新 2023-12-14 10:57:47
jsp
SpringBoot集成前端模版（thymeleaf）的配置步骤

本文介绍了在SpringBoot中集成thymeleaf前端模版的配置步骤，包括在application.properties配置文件中添加thymeleaf的配置信息，引入thymeleaf的jar包，以及创建PageController并添加index方法。 ... [详细]

蜡笔小新 2023-12-14 10:11:46
jsp
知识图谱——机器大脑中的知识库

本文介绍了知识图谱在机器大脑中的应用，以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例，说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案，如搜索关键词"Marie Curie"，会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革，不仅美国的微软必应，中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]

蜡笔小新 2023-12-14 10:06:19
jsp
测试人的性格，点火让他着急，考验婚姻问题的善意玩人

本文讲述了作者通过点火测试男友的性格和承受能力，以考验婚姻问题。作者故意不安慰男友并再次点火，观察他的反应。这个行为是善意的玩人，旨在了解男友的性格和避免婚姻问题。 ... [详细]

蜡笔小新 2023-12-14 09:10:09
process
Linux进程控制块PCBtask_struct结构体结构及作用详解

本文详细介绍了Linux中进程控制块PCBtask_struct结构体的结构和作用，包括进程状态、进程号、待处理信号、进程地址空间、调度标志、锁深度、基本时间片、调度策略以及内存管理信息等方面的内容。阅读本文可以更加深入地了解Linux进程管理的原理和机制。 ... [详细]

蜡笔小新 2023-12-13 21:31:18
text
java 线程死锁模拟

1，关于死锁的理解死锁，我们可以简单的理解为是两个线程同时使用同一资源，两个线程又得不到相应的资源而造成永无相互等待的情况。 2，模拟死锁背景介绍：我们创建一个朋友 ... [详细]

蜡笔小新 2023-12-13 19:12:25
text
后台获取视图对应的字符串

1.帮助类后台获取视图对应的字符串publicclassViewHelper{将View输出为字符串(注：不会执行对应的ac ... [详细]

蜡笔小新 2023-12-13 18:03:01
main
动态规划算法的基本步骤及最长递增子序列问题详解

本文详细介绍了动态规划算法的基本步骤，包括划分阶段、选择状态、决策和状态转移方程，并以最长递增子序列问题为例进行了详细解析。动态规划算法的有效性依赖于问题本身所具有的最优子结构性质和子问题重叠性质。通过将子问题的解保存在一个表中，在以后尽可能多地利用这些子问题的解，从而提高算法的效率。 ... [详细]

蜡笔小新 2023-12-13 15:38:19
jsp
Java验证码——kaptcha的使用配置及样式

本文介绍了如何使用kaptcha库来实现Java验证码的配置和样式设置，包括pom.xml的依赖配置和web.xml中servlet的配置。 ... [详细]

蜡笔小新 2023-12-13 13:58:25
select
高质量SQL书写的30条建议

本文提供了30条关于优化SQL的建议，包括避免使用select *，使用具体字段，以及使用limit 1等。这些建议是基于实际开发经验总结出来的，旨在帮助读者优化SQL查询。 ... [详细]

蜡笔小新 2023-12-13 13:24:33
main
指针的引用以及在什么情况下使用指针的引用

本文介绍了指针的概念以及在函数调用时使用指针作为参数的情况。指针存放的是变量的地址，通过指针可以修改指针所指的变量的值。然而，如果想要修改指针的指向，就需要使用指针的引用。文章还通过一个简单的示例代码解释了指针的引用的使用方法，并思考了在修改指针的指向后，取指针的输出结果。 ... [详细]

蜡笔小新 2023-12-13 12:54:29
jsp
工程中添加Android Dependencies

在project.properties添加#Projecttarget.targetandroid-19android.library.reference.1..Sliding ... [详细]

蜡笔小新 2023-12-13 12:08:09

幸福天使之宝贝

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章