当前位置: 开发笔记 > 编程语言 > 正文

HBase（二）之常用命令

作者：anilshen_333 | 来源：互联网 | 2023-09-05 14:56

文章目录1.其他操作2表的操作2.1.list：列出HBase的所有表2.2create：创建一个表2.3desc：提供了一个表的描述2.

文章目录

1.其他操作
2 表的操作
- 2.1. list&＃xff1a;列出HBase的所有表
- 2.2 create&＃xff1a;创建一个表
- 2.3 desc&＃xff1a;提供了一个表的描述
- 2.4 disable**:** 禁用表
- 2.5 enable**:** 启用一个表
- 2.6. exists**:** 验证表是否存在
- 2.7. count&＃xff1a;统计行数
- 2.8. drop**:** 从HBase中删除表
- 2.9 truncate&＃xff1a;清空表
- 2.10 get_splits&＃xff1a;获取Region
- 2.11 alter&＃xff1a;修改表
3.数据操作
- 3.1 scan**:** 扫描并返回表数据
- 3.2 put
- 3.3 get
- 3.4 delete

首先启动master

hbase-daemon.sh start master

使用hbase shell可以进入一个shell命令行界面&＃xff01;出现下图代表成功

HBase shell

1.其他操作

1.查看集群状态

使用status可以查看集群状态&＃xff0c;默认为summary&＃xff0c;可以选择‘simple’和‘detailed’来查看详情。

hbase(main):001:0> status 1 active master, 0 backup masters, 1 servers, 0 dead, 7.0000 average load

2.查看版本

hbase(main):002:0> version 1.2.0-cdh5.14.2, rUnknown, Tue Mar 27 13:31:54 PDT 2018

3.查看操作用户及组信息

hbase(main):004:0> whoami root (auth:SIMPLE)groups: root

4.查看表操作信息

table_help

5.查看帮助信息

help

6.查看具体命令的帮助

help &＃39;get&＃39;

注意引号是必须的&＃xff01;

2 表的操作

2.1. list&＃xff1a;列出HBase的所有表

hbase(main):007:0> list TABLE abc cust customer emp_basic 4 row(s) in 0.0510 seconds

list后可以使用*等通配符来进行表的过滤&＃xff01;

hbase(main):016:0> list &＃39;c.*&＃39; TABLE cust customer 2 row(s) in 0.0060 seconds

2.2 create&＃xff1a;创建一个表

创建表时&＃xff0c;需要指定表名和列族名&＃xff0c;而且至少需要指定一个列族&＃xff0c;没有列族的表是没有任何意义的。

创建表时&＃xff0c;还可以指定表的属性&＃xff0c;表的属性需要指定在列族上&＃xff01;

格式&＃xff1a;

create &＃39;表名&＃39;, { NAME &＃61;> &＃39;列族名1&＃39;, 属性名 &＃61;> 属性值}, {NAME &＃61;> &＃39;列族名2&＃39;, 属性名 &＃61;> 属性值}, …

如果你只需要创建列族&＃xff0c;而不需要定义列族属性&＃xff0c;那么可以采用以下快捷写法&＃xff1a;

create&＃39;表名&＃39;,&＃39;列族名1&＃39; ,&＃39;列族名2&＃39;, …

hbase(main):001:0> create &＃39;student&＃39;,&＃39;info&＃39;

2.3 desc&＃xff1a;提供了一个表的描述

hbase(main):003:0> desc &＃39;student&＃39; Table student is ENABLED student COLUMN FAMILIES DESCRIPTION {NAME &＃61;> &＃39;info&＃39;, BLOOMFILTER &＃61;> &＃39;ROW&＃39;, VERSIONS &＃61;> &＃39;1&＃39;, IN_MEMORY &＃61;> &＃39;false&＃39;, KEEP_DELETED_CE LLS &＃61;> &＃39;FALSE&＃39;, DATA_BLOCK_ENCODING &＃61;> &＃39;NONE&＃39;, TTL &＃61;> &＃39;FOREVER&＃39;, COMPRESSION &＃61;> &＃39;NONE&＃39;, MIN_V ERSIONS &＃61;> &＃39;0&＃39;, BLOCKCACHE &＃61;> &＃39;true&＃39;, BLOCKSIZE &＃61;> &＃39;65536&＃39;, REPLICATION_SCOPE &＃61;> &＃39;0&＃39;} 1 row(s) in 0.0320 seconds

2.4 disable**&＃x1f617;* 禁用表

停用表后&＃xff0c;可以防止在对表做一些维护时&＃xff0c;客户端依然可以持续写入数据到表。一般在删除表前&＃xff0c;必须停用表。

在对表中的列族进行修改时&＃xff0c;也需要停用表。

hbase(main):004:0> disable &＃39;student&＃39;

disable_all ‘正则表达式’ 可以使用正则来匹配表名。

is_disabled 可以用来判断表是否被停用。

hbase(main):006:0> is_disabled &＃39;student&＃39; true

2.5 enable**&＃x1f617;* 启用一个表

和停用表类似。enable ‘表名’用来启用表&＃xff0c;is_enabled ‘表名’用来判断一个表是否被启用。
enable_all ‘正则表达式’可以通过正则来过滤表&＃xff0c;启用复合条件的表。

2.6. exists**&＃x1f617;* 验证表是否存在

hbase(main):007:0> exists &＃39;student&＃39; Table student does exist

2.7. count&＃xff1a;统计行数

hbase(main):014:0> count &＃39;student&＃39; 0 row(s) in 0.0260 seconds&＃61;> 0

2.8. drop**&＃x1f617;* 从HBase中删除表

删除表前&＃xff0c;需要先disable表&＃xff0c;否则会报错。ERROR: Table xxx is enabled. Disable it first.

hbase(main):011:0> drop &＃39;person&＃39;

2.9 truncate&＃xff1a;清空表

hbase(main):015:0> truncate &＃39;student&＃39; Truncating &＃39;student&＃39; table (it may take a while):- Disabling table...- Truncating table... 0 row(s) in 3.4410 seconds

2.10 get_splits&＃xff1a;获取Region

获取表所对应的Region个数。每个表在一开始只有一个region&＃xff0c;之后记录增多后&＃xff0c;region会被自动拆分。

hbase(main):017:0> get_splits &＃39;student&＃39; Total number of splits &＃61; 1&＃61;> []

2.11 alter&＃xff1a;修改表

alter命令可以修改表的属性&＃xff0c;通常是修改某个列族的属性。

增加&＃xff1a;alter ‘表名’,NAME&＃61;>‘列簇名’

删除&＃xff1a;alter ‘表名’,NAME&＃61;>‘列簇名’&＃xff0c;METHOD&＃61;>‘delete’

hbase(main):021:0> alter &＃39;student&＃39;,&＃39;studentno&＃39; Updating all regions with the new schema... 1/1 regions updated. Done. 0 row(s) in 1.9240 seconds

hbase(main):028:0> alter &＃39;student&＃39;,NAME&＃61;>&＃39;studentno&＃39;,METHOD&＃61;>&＃39;delete&＃39; Updating all regions with the new schema... 1/1 regions updated. Done. 0 row(s) in 1.9420 seconds
3.数据操作

3.1 scan**&＃x1f617;* 扫描并返回表数据

scan命令可以按照rowkey的字典顺序来遍历指定的表的数据。

scan ‘表名’&＃xff1a;默认当前表的所有列族。

scan ‘表名’,{COLUMNS&＃61;> [‘列族:列名’],…} &＃xff1a; 遍历表的指定列

scan &＃39;emp_basic&＃39;,{COLUMNS&＃61;>&＃39;emp:name&＃39;}

scan ‘表名’, { STARTROW &＃61;> ‘起始行键’, ENDROW &＃61;> ‘结束行键’ }&＃xff1a;指定rowkey范围。如果不指定&＃xff0c;则会从表的开头一直显示到表的结尾。区间为左闭右开。

&＃xff08;由于rowkey并不是整型&＃xff0c;所以不会按照数字顺序筛选&＃xff09;

scan &＃39;emp_basic&＃39;,{STARTROW&＃61;>&＃39;100&＃39;,ENDROW&＃61;>&＃39;200&＃39;}

scan ‘表名’, { LIMIT &＃61;> 行数量}&＃xff1a; 指定返回的行的数量

scan &＃39;emp_basic&＃39;,{LIMIT&＃61;>5}

scan ‘表名’, {VERSIONS &＃61;> 版本数}&＃xff1a;返回cell的多个版本

scan &＃39;emp_basic&＃39;,{VERSIONS&＃61;>5}

scan ‘表名’, { TIMERANGE &＃61;> [最小时间戳, 最大时间戳]}&＃xff1a;指定时间戳范围
注意&＃xff1a;此区间是一个左闭右开的区间&＃xff0c;因此返回的结果包含最小时间戳的记录&＃xff0c;但是不包含最大时间戳记录

scan ‘表名’, { RAW &＃61;> true, VERSIONS &＃61;> 版本数}

显示原始单元格记录&＃xff0c;在Hbase中&＃xff0c;被删掉的记录在HBase被删除掉的记录并不会立即从磁盘上清除&＃xff0c;而是先被打上墓碑标记&＃xff0c;然后等待下次major compaction的时候再被删除掉。注意RAW参数必须和VERSIONS一起使用&＃xff0c;但是不能和COLUMNS参数一起使用。

scan ‘表名’, { FILTER &＃61;> “过滤器”} and|or { FILTER &＃61;> “过滤器”}: 使用过滤器扫描

3.2 put

put可以新增记录还可以为记录设置属性。

put ‘表名’, ‘行键’, ‘列名’, ‘值’

put ‘表名’, ‘行键’, ‘列名’, ‘值’,时间戳

put ‘表名’, ‘行键’, ‘列名’, ‘值’, { ‘属性名’ &＃61;> ‘属性值’}

put ‘表名’, ‘行键’, ‘列名’, ‘值’,时间戳, { ‘属性名’ &＃61;>‘属性值’}

put &＃39;student&＃39;,&＃39;1001&＃39;,&＃39;info:name&＃39;,&＃39;Nick&＃39;put &＃39;student&＃39;,&＃39;1001&＃39;,&＃39;info:sex&＃39;,&＃39;male&＃39;put &＃39;student&＃39;,&＃39;1001&＃39;,&＃39;info:age&＃39;,&＃39;18&＃39;put &＃39;student&＃39;,&＃39;1002&＃39;,&＃39;info:name&＃39;,&＃39;Janna&＃39;put &＃39;student&＃39;,&＃39;1002&＃39;,&＃39;info:sex&＃39;,&＃39;female&＃39;put &＃39;student&＃39;,&＃39;1002&＃39;,&＃39;info:age&＃39;,&＃39;20&＃39;

3.3 get

get支持scan所支持的大部分属性&＃xff0c;如COLUMNS&＃xff0c;TIMERANGE&＃xff0c;VERSIONS&＃xff0c;FILTER

get &＃39;student&＃39;,&＃39;1001&＃39;

3.4 delete

删除某rowkey的全部数据

deleteall &＃39;student&＃39;,&＃39;1001&＃39;

删除某rowkey的某一列数据&＃xff1a;

delete &＃39;student&＃39;,&＃39;1002&＃39;,&＃39;info:sex&＃39;

推荐阅读

list
如何在Java中使用DButils类

这期内容当中小编将会给大家带来有关如何在Java中使用DButils类，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。D ... [详细]

蜡笔小新 2024-11-12 13:46:11
range
（7）Python爬虫——爬取豆瓣电影Top250

利用python爬取豆瓣电影Top250的相关信息，包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容，然后将爬取的信息写入Exce ... [详细]

蜡笔小新 2024-11-13 11:35:24
range
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
ip
解决 Ubuntu 环境下 Hadoop 集群 SSH 密钥认证问题

本文详细介绍了在 Ubuntu 系统上搭建 Hadoop 集群时遇到的 SSH 密钥认证问题及其解决方案。通过本文，读者可以了解如何在多台虚拟机之间实现无密码 SSH 登录，从而顺利启动 Hadoop 集群。 ... [详细]

蜡笔小新 2024-11-13 09:14:02
ip
解决Bootstrap DataTable Ajax请求重复问题

在最近的一个项目中，我们使用了JQuery DataTable进行数据展示，虽然使用起来非常方便，但在测试过程中发现了一个问题：当查询条件改变时，有时查询结果的数据不正确。通过FireBug调试发现，点击搜索按钮时，会发送两次Ajax请求，一次是原条件的请求，一次是新条件的请求。 ... [详细]

蜡笔小新 2024-11-12 13:59:27
python
python解决CSF布料模拟滤波的批处理问题（解决获取多个点云数据las数据）

解决问题：1、批量读取点云las数据2、点云数据读与写出3、csf滤波分类参考：https:github.comsuyunzzzCSF论文题目ÿ ... [详细]

蜡笔小新 2024-11-12 11:32:15
ip
开机自启动的几种方式

0x01快速自启动目录快速启动目录自启动方式源于Windows中的一个目录，这个目录一般叫启动或者Startup。位于该目录下的PE文件会在开机后进行自启动 ... [详细]

蜡笔小新 2024-11-12 11:16:30
install
Android 构建基础流程详解

Android 构建基础流程详解 ... [详细]

蜡笔小新 2024-11-10 15:45:20
ip
服务器部署中的安全策略实践与优化

服务器部署中的安全策略实践与优化 ... [详细]

蜡笔小新 2024-11-10 13:04:30
ip
Halcon之图像梯度、图像边缘、USM锐化

图像梯度、图像边缘、USM锐化图像梯度、图像边缘、USM锐化图像梯度、图像边缘、USM锐化图像卷积：1.模糊2.梯度3.边缘4.锐化1.视频教程：B站、 ... [详细]

蜡笔小新 2024-11-12 21:40:43
ip
Spark与HBase结合处理大规模流量数据结构设计

本文将详细介绍如何利用Spark和HBase进行大规模流量数据的分析与处理，包括数据结构的设计和优化方法。 ... [详细]

蜡笔小新 2024-11-12 19:49:05
python
Python 使用 DOM 和 SAX 解析 XML 的应用实例

本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件，并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]

蜡笔小新 2024-11-12 16:10:39
python
Django Admin 管理后台使用指南

本文详细介绍了如何在 Django 项目中使用 Admin 管理后台，包括创建超级用户、启动项目、管理数据模型和修改用户密码等步骤。 ... [详细]

蜡笔小新 2024-11-12 13:27:04
input
思科IOS XE与ISE集成实现TACACS认证配置

本文详细介绍了如何在思科IOS XE设备上配置TACACS认证，并通过ISE（Identity Services Engine）进行用户管理和授权。配置包括网络拓扑、设备设置和ISE端的具体步骤。 ... [详细]

蜡笔小新 2024-11-12 13:17:06
future
利用Python Paramiko库批量更新多台服务器的登录密码

本文介绍了如何使用Python的Paramiko库批量更新多台服务器的登录密码。通过示例代码展示了具体实现方法，确保了操作的高效性和安全性。Paramiko库提供了强大的SSH2协议支持，使得远程服务器管理变得更加便捷。此外，文章还详细说明了代码的各个部分，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-11 19:17:23

anilshen_333

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章