hbase修改表名

2019独角兽企业重金招聘Python工程师标准>>>

hbase修改表名

hbase修改表名没有直接的api可以调用&＃xff0c;我们如果想要修改表名&＃xff0c;可以利用快照的方式。

需要开启快照功能&＃xff0c;在hbase-site.xml文件中添加如下配置项&＃xff1a;

hbase.snapshot.enabled
true

命令
hbase shell> disable &＃39;tableName&＃39;
hbase shell> snapshot &＃39;tableName&＃39;, &＃39;tableSnapshot&＃39;
hbase shell> clone_snapshot &＃39;tableSnapshot&＃39;, &＃39;newTableName&＃39;

然后我们就可以测试一下新表是否建立成功。

快照是什么&＃xff1f;

快照就是一份元信息的合集&＃xff0c;允许管理员恢复到表的先前状态。快照不是表的复制而是一个文件名称列表&＃xff0c;因而不会复制数据。完全快照恢复是指恢复到之前的“表结构”以及当时的数据&＃xff0c;快照之后发生的数据不会恢复。

操作

生成快照&＃xff1a;本操作尝试对指定表生成快照。如果集群在执行数据均衡、分隔或合并等操作时&＃xff0c;可能会引起操作失败。
克隆快照&＃xff1a;本操作使用与指定快照相同的结构数据构建一张新表。操作结果会生成一张有完整功能的表&＃xff0c;对该表的任意修改不会对原表或快照产生影响。
还原快照&＃xff1a;本操作将表结构和数据恢复到生成快照时的状态。&＃xff08;注意&＃xff1a;本操作会舍弃快照生成后任何改变&＃xff09;。
删除快照&＃xff1a;本操作将系统中的快照删除&＃xff0c;释放未共享的磁盘空间&＃xff0c;而且不会影响其他克隆或快照。
导出快照&＃xff1a;本操作将快照数据和元数据复制到其他集群。操作只会涉及HDFS&＃xff0c;不会与Master或域服务器产生任何联系&＃xff0c;因此HBase集群可以关闭。
零复制快照&＃xff0c;恢复&＃xff0c;克隆

快照和复制/导出表之间的主要差异是快照操作只写入元数据&＃xff0c;不涉及海量数据。

HBase的主要设计原则之一就是一旦文件写入就不再修改。文件不可变意味着快照只需保持对快照产生时存在的文件追踪&＃xff0c;并且在压缩时负责提示系统该文件不应删除而是应当归档保存。

同样的原则也适用于克隆和恢复操作。因为文件是不变的&＃xff0c;新建一个表只需要通过快照“链接”到文件引用即可。

导出快照是唯一需要复制数据的操作&＃xff0c;因为其他集群没有数据文件。

导出快照 vs 复制/导出表

导出快照与复制/导出表除了更好地保持一致性外&＃xff0c;主要的不同在于导出快照是在HDFS的层面操作的。这意味这Master和域服务器与操作无关。因此不需要为不必要的数据创建缓存空间&＃xff0c;也不会有扫描过程因为大量对象创建引起的GC暂停。对于HBase来说主要性能影响就是DataNode额外的网络和磁盘负载。

HBase命令&＃xff1a;快照操作

通过检查hbase-site.xml中的hbase.snapshot.enabled是否设置为true确认打开了快照许可。获取指定表的快照使用snapshot命令&＃xff08;不产生文件复制&＃xff09;

hbase>snapshot ‘tableName’, ‘snapshotName’

列出所有的快照&＃xff0c;使用 list_snapshot 命令。会展示出快照名称&＃xff0c;源表&＃xff0c;以及创建日期和时间

hbase>list_snapshots

使用clone_snapshot命令从指定的快照生成新表&＃xff08;克隆&＃xff09;。由于不会产生数据复制&＃xff0c;所以最终用到的数据不会是之前的两倍。

hbase>clone_snapshot ‘snapshotName’, ‘newTableName’

使用restore_snapshot命令将指定快照内容替换当前表结构/数据。

用快照恢复数据&＃xff0c;它需要先禁用表&＃xff0c;再进行恢复

hbase>disable &＃39;myTable&＃39; hbase>restore_snapshot ‘snapshotName’

删除快照使用 deleted_snapshot 命令。删除快照不会影响到克隆表或者之后生成的快照。

hbase>delete_snapshot ‘snapshotName’

使用ExportSnapshot工具将现有快照导出至其他集群。导出工具不会影响到域服务器负载&＃xff0c;只是工作在HDFS层面所以需要指定HDFS路径&＃xff08;其他集群的hbase根目录&＃xff09;

采用16个mappers来把一个名为MySnapshot的快照复制到一个名为hbfreeoa2的集群当中
hbase class org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot MySnapshot -copy-to hdfs://hbfreeoa2:8020/hbase -mappers 16