当前位置: 开发笔记 > 编程语言 > 正文

csvphoenix导入_phoenix学习

作者：MiMe淘宝店 | 来源：互联网 | 2023-09-24 09:14

Phoenix是构建在HBase之上的关系型数据库层，作为内嵌的客户端JDBC驱动用以对HBase中的数据进行低延迟访问Phoenix会将用户编写的sql查询编译为一

Phoenix是构建在HBase之上的关系型数据库层&＃xff0c;作为内嵌的客户端JDBC驱动用以对HBase中的数据进行低延迟访问

Phoenix会将用户编写的sql查询编译为一系列的scan操作&＃xff0c;最终产生通用的JDBC结果集返回给客户端

Phoenix可以看成是mysql

准备安装包

apache-phoenix-4.12.0-HBase-1.2-bin.tar.gz

解压Phoenix

tar -zxvf apache-phoenix-4.12.0-HBase-1.2-bin.tar.gz

改下名字

mv apache-phoenix-4.12.0-HBase-1.2-bin phoenix-4.12.0

看下目录结构

将jar拷贝到hbase的lib目录下

phoenix-4.12.0-HBase-1.2-client.jar

phoenix-core-4.12.0-HBase-1.2.jar

cp phoenix-4.12.0-HBase-1.2-client.jar /opt/bigdata/hbase-1.2.1/lib/

cp phoenix-core-4.12.0-HBase-1.2.jar /opt/bigdata/hbase-1.2.1/lib/

重启hbase服务&＃xff0c;让配置生效

找到hbase-site.xml文件&＃xff0c;将hbase/conf下的hbase-site.xml文件拷贝到Phoenix/bin目录下覆盖掉&＃xff0c;或者直接修改

hbase.tmp.dir

/opt/bigdata/hbase-1.2.1/data

hbase.rootdir

hdfs://masterhbase:8082/hbase

hbase.cluster.distributed

true

hbase.zookeeper.quorum

masterhbase,masterslave1,masterslave2

zookeeper.znode.parent

/hbase

hbase.regionserver.wal.codec

org.apache.hadoop.hbase.regionserver.wal.IndexedWALEditCodec

安装工具

yum -y install python-argparse

启动Phoenix&＃xff1a;指定ZK的地址以及端口号&＃xff0c;作为hbase的访问入口

bin/sqlline.py masterhbase:2181

在HBase中输入list&＃xff0c;会发现多一些表

语句大多数类似mysql语句&＃xff0c;但是没有show database table list都不行用help帮助信息

!tables 当前phoenix的系统表&＃xff0c;hbase中也会有这些表&＃xff0c;表示关联成功一半

创建表

CREATE TABLE user (

id varchar PRIMARY KEY,

name varchar ,

passwd varchar

);

在HBase Shell中可以看到

hbase区分大小写

Phoenix不区分大小写&＃xff0c;默认情况下都是大写&＃xff0c;变小写加上双引号就可以

在hbase的shell中&＃xff1a;describe &＃39;USER&＃39; 查看

得知默认列族为0&＃xff0c;id主键字段对应到hbase的ROW字段

phoenix插入数据: updata&＃43;insert结合(upsert)更新数据与这个语句是一样的

upsert into user(id, name, passwd) values(&＃39;001&＃39;, &＃39;admin&＃39;, &＃39;admin&＃39;);

在HBase Shell中查看

scan &＃39;USER&＃39;

phoenix删除表

drop table user;

phoenix指定列族

CREATE TABLE user (

id varchar PRIMARY KEY,

INFO.name varchar ,

INFO.passwd varchar

);

在hbase shell中查看

phoenix查询语句&＃xff1a;

select * from user;

select name from user where id &＃61;&＃39;001&＃39;;

phoenix删除语句&＃xff1a;

delete from user where id&＃61;&＃39;001&＃39;;

在phoenix的CLI界面中进行简单的CRUD操作&＃xff0c;基本上与RDBMS的操作没有太大区别。

hbase与phoenix表与表进行关联

在phoenix中&＃xff1a;列的顺序可以不一致&＃xff0c;表名称必须一致&＃xff0c;以及列名称一致

在HBase中有一张表

我们在phoenix做映射创建

create table "stu_info_importtsv"(

"ROW" varchar primary key,

"f1"."location" varchar,

"f2"."age" varchar,

"f1"."name" varchar,

"f3"."addr" varchar

);

查看下数据

回到hbase中会发现一些变化&＃xff0c;不会影响&＃xff0c;可忽略

phoenix数据类型&＃xff1a;

char

varchar

decimal

tinyint

smallint

integer

bigint

float

double

timestamp

date

time

binary

varbinary

phoenix导入csv文件数据(批量)&＃xff1a;

注意&＃xff1a;要加载的所有CSV文件都必须具有".csv"文件扩展名

另外phoenix也支持mr做一个批量数据导入

Phoenix创建表

create table if not exists bulkdata (

state char(2) not null,

city varchar not null,

population bigint

constraint my_pk primary key (state, city)

);

准备数据

NY,New York,8143197

CA,Los Angeles,3844829

IL,Chicago,2842518

TX,Houston,2016582

PA,Philadelphia,1463281

AZ,Phoenix,1461575

TX,San Antonio,1256509

CA,San Diego,1255540

TX,Dallas,1213825

CA,San Jose,912332

如果没有指定表的名称&＃xff0c;他根据文件名称来找对应的表

(bin/psql.py masterhbase /data/phoeniximport.csv 没有指定表名称)

bin/psql.py -t BULKDATA masterhbase /data/phoeniximport.csv

查询数据

如果使用sql文件

执行语句

/opt/bigdata/phoenix-4.12.0/bin/psql.py /data/testphoenix.sql

查看表也是有的

我们看下HBase中

主键就是hbase对应的rowkey&＃xff0c;为了防止hbase主键的唯一性&＃xff0c;可以设置多个字段为主键

这个表就是多个字段的主键

在hbase中添加数据和phoenix添加数据的不同&＃xff1a;

添加数据

upsert into bulkdata(state, city, population) values(&＃39;NY&＃39;, &＃39;admin&＃39;, 212313);

查看下

再添加

put &＃39;BULKDATA&＃39;,&＃39;41&＃39;,&＃39;0:population&＃39;,&＃39;2222&＃39;

put &＃39;BULKDATA&＃39;,&＃39;41&＃39;,&＃39;0:city&＃39;,&＃39;SHANGHAI&＃39;

put &＃39;BULKDATA&＃39;,&＃39;41&＃39;,&＃39;0:state&＃39;,&＃39;tom&＃39;

查看下

但是在phoenix中没有

总结&＃xff1a;

首先&＃xff0c;这张表是在phoenix中创建

在phoenix中更新数据&＃xff0c;hbase也会更新

在hbase中更新数据&＃xff0c;phoenix是不会更新的

一些小补充&＃xff1a;

1、phoenix JAVA API也可以

phoenix-4.12.0-HBase-1.2-client.jar

phoenix-core-4.12.0-HBase-1.2.jar

添加到项目的classpath中&＃xff0c;代码风格类似JDBC&＃xff0c;这个网上很多&＃xff0c;不做过多练习。

2、一个第三方工具

使用Squirrel GUI客户端来连接phoenix

就像MySQL使用Navicat for MySQL&＃xff0c;小海豚一样的连接工具&＃xff0c;在进行一些数据库操作的时候能够更加的直观和方便

将下载的jar文件双击进行安装&＃xff0c;直接下一步即可

将phoenix-4.12.0-HBase-1.2-client.jar拷贝到squirrel安装目录的lib目录下。

启动&＃xff1a;进入Drivers标签页创建新的Driver (加号)

参数说明&＃xff1a;

Name&＃xff1a;hbasetest(可以填写其他名称)

ExampleURL&＃xff1a;填写HBase集群的zookeeper集群的连接信息&＃xff0c;这里是jdbc:phoenix:hbasemaster:2181

Website URL&＃xff1a;这里不填写

Java Class Path&＃xff1a;选择phoenix-4.2.2-client.jar(是否选中无所谓&＃xff0c;只要在Java Class Path里面就行)

进入Aliases标签页创建新的Alias(加号)

参数说明&＃xff1a;

Name&＃xff1a;hbasemaster(可以填写其他名称)

Driver&＃xff1a;选择ibeifeng.class&＃xff0c;即上一步创建的Driver

URL&＃xff1a;这里就是HBase集群的zookeeper的连接ip和port

User Name&＃xff1a;随便填写

Password&＃xff1a;随便填写

在Aliases标签中双击刚刚创建的phoenix打开连接

点击SQL标签进入sql命令行界面&＃xff0c;输入语句执行(小人走路的是执行按钮)

练习语句

create table if not exists mytable (

id integer primary key,

name varchar,

sex varchar,

address varchar

);

upsert into mytable values (1, &＃39;wxb&＃39;, &＃39;male&＃39;, &＃39;010-22222222&＃39;);

upsert into mytable values (2, &＃39;ll&＃39;, &＃39;male&＃39;, &＃39;010-11111111&＃39;);

select * from mytable;

select * from "stu_info"

依然注意大小写

在SQuirrel中&＃xff0c;执行sql语句时&＃xff0c;按Ctrl &＃43; Enter键就可以执行了

推荐阅读

dagger
Android 开发框架整合：MVP + Retrofit + Dagger2 + RxAndroid 配置指南

本文将详细介绍如何配置并整合MVP架构、Retrofit网络请求库、Dagger2依赖注入框架以及RxAndroid响应式编程库，构建高效、模块化的Android应用。 ... [详细]

蜡笔小新 2024-11-24 20:16:02
io
如何使用Maven将依赖插件一并打包进JAR文件

本文详细介绍了在使用Maven构建项目时，如何将所需的依赖插件一同打包进最终的JAR文件中，以避免手动部署依赖库的麻烦。 ... [详细]

蜡笔小新 2024-11-23 22:51:34
split
Hadoop MapReduce 实战案例：手机流量使用统计分析

本文通过一个具体的Hadoop MapReduce案例，详细介绍了如何利用MapReduce框架来统计和分析手机用户的流量使用情况，包括上行和下行流量的计算以及总流量的汇总。 ... [详细]

蜡笔小新 2024-11-23 20:11:23
web
Java虚拟机及其发展历程

Java虚拟机（JVM）是每个Java开发者日常工作中不可或缺的一部分，但其背后的运作机制却往往显得神秘莫测。本文将探讨Java及其虚拟机的发展历程，帮助读者深入了解这一关键技术。 ... [详细]

蜡笔小新 2024-11-23 08:59:58
main
Python脚本实现批量删除多种类型文件的扩展名

本文介绍了一个Python脚本，用于批量处理并移除指定目录下不同格式文件（如png、jpg、xml、json、txt、gt等）的文件扩展名。该方法通过递归遍历文件夹中的所有文件，并对每个文件执行重命名操作。 ... [详细]

蜡笔小新 2024-11-25 16:01:13
process
利用Python在DragonBoard 410c上解析GPS数据获取位置信息

本文介绍了如何在DragonBoard 410c开发板上使用Python脚本来解析GPS报文，从而获取精确的位置信息。DragonBoard 410c集成了GPS、Wi-Fi和高性能GPU，非常适合用于各种物联网项目。 ... [详细]

蜡笔小新 2024-11-25 15:32:25
process
如何通过反编译查看APP源代码

本文详细介绍了使用dex2jar和jd-gui工具反编译Android应用（APK）以查看其源代码的具体步骤。通过更改文件扩展名、解压文件、转换dex文件为jar文件，并使用JD-GUI查看最终的Java源代码。 ... [详细]

蜡笔小新 2024-11-25 07:39:27
process
深入理解Spark 2.2.0集群模式

本文详细介绍了Apache Spark 2.2.0版本中集群模式的基本概念和工作流程，包括如何通过集群管理器分配资源，以及Spark应用程序在集群中的运行机制。链接：http://spark.apache.org/docs/2.2.0/cluster-overview.html ... [详细]

蜡笔小新 2024-11-24 08:56:47
process
Maven快照版本管理及更新策略详解

本文深入探讨了Maven中的快照版本管理和更新策略，解释了快照版本与正式版本的区别，并提供了如何配置快照更新策略的方法，以确保项目依赖始终保持最新。 ... [详细]

蜡笔小新 2024-11-24 06:20:08
process
在CentOS 7中部署Nginx并配置SSL证书

本文详细介绍了如何在CentOS 7操作系统上安装Nginx服务器，并配置SSL证书以增强网站的安全性。适合初学者和中级用户参考。 ... [详细]

蜡笔小新 2024-11-24 02:18:19
object
将XML数据迁移至Oracle Autonomous Data Warehouse (ADW)

随着Oracle ADW的推出，数据迁移至ADW成为业界关注的焦点。特别是XML和JSON这类结构化数据的迁移需求日益增长。本文将通过一个实际案例，探讨如何高效地将XML数据迁移至ADW。 ... [详细]

蜡笔小新 2024-11-23 20:27:56
io
如何高效学习鸿蒙操作系统：开发者指南

本文探讨了开发者如何更有效地学习鸿蒙操作系统，提供了来自行业专家的建议，包括系统化学习方法、职业规划建议以及具体的开发技巧。 ... [详细]

蜡笔小新 2024-11-23 19:22:14
case
Gradle 配置详解与实践

Gradle 是 Android Studio 中默认的构建工具，了解其基本配置对于开发效率的提升至关重要。本文将详细介绍如何在 Gradle 中定义和使用共享变量，以确保项目的一致性和可维护性。 ... [详细]

蜡笔小新 2024-11-23 15:07:47
php
LaTeX高级应用技巧

本文分享了作者在使用LaTeX过程中的几点心得，涵盖了从文档编辑、代码高亮、图形绘制到3D模型展示等多个方面的内容。适合希望深入了解LaTeX高级功能的用户。 ... [详细]

蜡笔小新 2024-11-23 12:47:16
web
Servlet基础入门指南（上）

本文介绍了Tomcat的基本操作，包括启动、关闭及首次访问的方法，并详细讲解了如何在IDEA中创建Web项目，配置Servlet及其映射，以及如何将项目部署到Tomcat。 ... [详细]

蜡笔小新 2024-11-23 11:55:30

MiMe淘宝店

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章