HBase是Google Bigtable的开源实现,通过在Windows下部署HBase,可以解决在单机开发中用到HBase问题,项目正式上线时,可以使用Linux分布式部署的HBase。本文hbase的数据保存在磁盘上。
1、 搭建环境
下载HBase
从官网上下载hbase-2.1.5-bin.tar安装包。
下载地址:https://hbase.apache.org/downloads.html,
下载hbase-2.1.5-bin.tar,解压缩到D:hadoophbase-2.1.5。
可能需要两个jar包:htrace-core4-4.1.0-incubating.jar和jansi-1.8.jar否则启动会报如下两个错误。
如有需要可私信关键词:20190616,获取下载地址。
2、 配置 Hbase
1. 配置hbase-env.cmd
首先进入目录D:hadoophbase-2.1.5conf找到hbase-env.cmd
用记事本打开,在文件的末尾添加下面配置(HBASE_MANAGES_ZK为true时使用默认自带的):
set HBASE_MANAGES_ZK=true
Hbase提供了HBASE_MANAGES_ZK变量来设置是否管理zookeeper集群,默认情况,HBASE_MANAGES_ZK设置为true
如果没用配置java。可在这个文件末尾在增加一行,指定java路径:
set JAVA_HOME= D:Javajdk1.8.0_181
以管理员方式启动 CMD 命令提示符
进入 D:hadoophbase-2.1.5conf 目录,执行 hbase-env.cmd
2. 配置core-site.xml
用记事本打开,在文件的末尾间添加下面配置:
hbase.masterlocalhost:60000hbase.rootdirfile:///D:/hadoop/hbase-2.1.5/data/roothbase.tmp.dirD:/hadoop/hbase-2.1.5/data/tmphbase.zookeeper.quorumlocalhosthbase.zookeeper.property.dataDirD:/hadoop/hbase-2.1.5/data/zoohbase.cluster.distributedfalse
hbase.rootdir:来设置文件的保存位置指定一个文件夹,,被所有regionserver共享,例如:file:///you/hbase-data/path,你建立的HBase中的表和数据就直接写到了你的磁盘上,同样你也可以指定你的分布式文件系统HDFS的路径例:如:hdfs://NAMENODE_SERVER:PORT/HBASE_ROOTDIR,这样就写到了你的分布式文件系统上了。不改这个配置,数据会在重启的时候丢失。
hbase.tmp.dir:本地文件系统的临时文件夹。可以修改到一个更为持久的目录上。(/tmp会在重启时清除)默认:/tmp/hbase-${user.name}
hbase.zookeeper.quorum:重要的也是必须设置的,启动zk的服务器列表,逗号分隔,cluster模式下必须设置,默认是localhost,hbase客户端也需要设置这个值去访问zk;
hbase.zookeeper.property.dataDir:zk的配置,快照的存储位置
默认:${hbase.tmp.dir}/zookeeper;
hbase.cluster.distributed:hbase集群模式运作与否的标志,默认是false,开启需要设置为true,false时启动hbase会在一个jvm中运行hbase和zk;
3、 启动 Hbase
以管理员方式启动 CMD 命令提示符 进入 D:hadoophbase-2.1.5bin 目录
start-hbase.cmd,启动成功会开启 hbase 的窗口
4、 访问web
http://127.0.0.1:16010/master-status
5、 Hbase Shell基本操作
1. 进入shell
以管理员方式启动 CMD 命令提示符 进入 D:hadoophbase-2.1.5bin 目录,执行命令Hbase shell
启动成功会开启 hbase 的窗口
2. 使用 shell
输入 help 可以看到一列 shell 命令。这里的帮助很详细,要注意的是表名,行和列需要加引号。
3. 创建表
创建一个名为 test 的表,这个表只有一个 列族 为 cf。可以列出所有的表来检查创建情况, 然后插入些值。
create 'test_account','id','realname','username','age'
可以使用list命令来查看当前HBase里有哪些表。使用describe命令来查看表结构。
4. 按设计的表结构插入值
列族里边可以自由添加子列很方便。如果列族下没有子列,加不加冒号都是可以的。
put 'test_account','1','id:','1'put 'test_account','1','realname:','李晓燕'put 'test_account','1','username:','lxy'put 'test_account','1','age:','18'put 'test_account','2','id:','2'put 'test_account','2','realname:','张国鹏'put 'test_account','2','username:','zgp'put 'test_account','2','age:','23'
put命令比较简单,只有这一种用法:
put't1','r1','c1','value', ts1
t1指表名,r1指行键名,c1指列名,value指单元格值。ts1指时间戳,一般都省略掉了。
5. 根据键值查询数据
get 'test_account','1'get 'test_account','2','realname'
get有用法如下:
get't1′,'r1′get't1′,'r1′, {TIMERANGE => [ts1, ts2]}get't1′,'r1′, {COLUMN =>'c1′}get't1′,'r1′, {COLUMN => ['c1','c2','c3']}get't1′,'r1′, {COLUMN =>'c1′, TIMESTAMP => ts1}get't1′,'r1′, {COLUMN =>'c1′, TIMERANGE => [ts1, ts2], VERSIONS => 4}get't1′,'r1′, {COLUMN =>'c1′, TIMESTAMP => ts1, VERSIONS => 4}get't1′,'r1′,'c1′get't1′,'r1′,'c1′,'c2′get't1′,'r1′, ['c1','c2']
6. 扫描所有数据
scan 'test_account'
也可以指定一些修饰词:TIMERANGE, FILTER, LIMIT,STARTROW, STOPROW, TIMESTAMP, MAXLENGTH,or COLUMNS。没任何修饰词,就会显示所有数据行。
7. 删除指定数据
get 'test_account','2','realname'delete 'test_account','2','realname'get 'test_account','2','realname'get 'test_account','1','age'delete 'test_account','1','age'get 'test_account','1','age'
deleteall命令,可以进行整行的范围的删除操作,慎用!
deleteall 'test_account','1'
truncate命令,可以进行全表删除操作。
truncate 'test_account'
8. 删除表
Hbase删除表,必须先 disable 再 drop 这张表
listdisable 'test_account'drop 'test_account'list
9. 关闭 shell