热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python存数据到impala_如何使用PythonImpyla客户端连接Hive和Impala

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。1.文档编写目的继上一章讲述如何在CDH集群安装Anaconda&搭建Python私有

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

1.文档编写目的

继上一章讲述如何在CDH集群安装Anaconda&搭建Python私有源后,本章节主要讲述如何使用Pyton Impyla客户端连接CDH集群的HiveServer2和Impala Daemon,并进行SQL操作。

内容概述

1.依赖包安装

2.代码编写

3.代码测试

测试环境

1.CM和CDH版本为5.11.2

2.RedHat7.2

前置条件

1.CDH集群环境正常运行

2.Anaconda已安装并配置环境变量

3.pip工具能够正常安装Python包

4.Python版本2.6+ or 3.3+

5.非安全集群环境

2.Impyla依赖包安装

Impyla所依赖的Python包

six

bit_array

thrift (on Python 2.x) orthriftpy (on Python 3.x)

thrift_sasl

sasl

1.首先安装Impyla依赖的Python包

[root@ip-172-31-22-86~]# pip install bit_array[root@ip-172-31-22-86~]# pip install thrift==0.9.3[root@ip-172-31-22-86~]# pip install six

[root@ip-172-31-22-86~]# pip install thrift_sasl

[root@ip-172-31-22-86~]# pip install sasl

08a0619d-3b87-4b9e-aefc-49345f44945e.png

f512bb22-c68f-4545-a674-b129051a3f59.png

62e2dd79-b663-4cb8-abb2-ea9f2db9506a.png

84906597-4715-4314-980d-a00027b0b80c.png

注意:thrift的版本必须使用0.9.3,默认安装的为0.10.0版本,需要卸载后重新安装0.9.3版本,卸载命令pip uninstall thrift

2.安装Impyla包

impyla版本,默认安装的是0.14.0,需要将卸载后安装0.13.8版本

[root@ip-172-31-22-86ec2-user]# pip install impyla==0.13.8CollectingimpylaDownloadingimpyla-0.14.0.tar.gz (151kB)100%|████████████████████████████████|153kB1.0MB/sRequirementalready satisfied: sixin/opt/cloudera/parcels/Anaconda-4.2.0/lib/python2.7/site-packages (fromimpyla)

Requirementalreadysatisfied: bitarrayin/opt/cloudera/parcels/Anaconda-4.2.0/lib/python2.7/site-packages (fromimpyla)

Requirementalreadysatisfied: thriftin/opt/cloudera/parcels/Anaconda-4.2.0/lib/python2.7/site-packages (fromimpyla)

Buildingwheelsforcollected packages: impylaRunningsetup.py bdist_wheelforimpyla ...doneStoredindirectory: /root/.cache/pip/wheels/96/fa/d8/40e676f3cead7ec45f20ac43eb373edc471348ac5cb485d6f5Successfullybuilt impylaInstallingcollected packages: impylaSuccessfullyinstalled impyla-0.14.0

bbc0f5b3-a663-4269-a551-f4be211d49f1.png

3.编写Python代码

Python连接Hive(HiveTest.py)

fromimpala.dbapiimportconnect

conn=connect(host='ip-172-31-21-45.ap-southeast-1.compute.internal',port=10000,database='default',auth_mechan

ism='PLAIN')print(conn)cursor=conn.cursor()cursor.execute('show databases')printcursor.description# prints the result set's schemaresults=cursor.fetchall()print(results)cursor.execute('SELECT*FROM testlimit10')printcursor.description# prints the result set's schemaresults=cursor.fetchall()print(results)

Python连接Impala(ImpalaTest.py)

fromimpala.dbapiimportconnect

conn=connect(host='ip-172-31-26-80.ap-southeast-1.compute.internal',port=21050)print(conn)cursor=conn.cursor()cursor.execute('show databases')printcursor.description# prints the result set's schemaresults=cursor.fetchall()print(results)cursor.execute('SELECT*FROM testlimit10')printcursor.description# prints the result set's schemaresults=cursor.fetchall()print(results)

4.测试代码

在shell命令行执行Python代码测试

1.测试连接Hive

[root@ip-172-31-22-86ec2-user]# python HiveTest.py[('database_name', 'STRING', None, None, None, None, None)]

[('default',)]

[('test.s1', 'STRING',None, None, None, None, None),('test.s2', 'STRING', None, None, None, None, None)]

[('name1', 'age1'),('name2', 'age2'),('name3', 'age3'),('name4', 'age4'),('name5', 'age5'),('name6', 'age6'),('name7', 'age7'),('name8', 'age8'),('name9', 'age9'),('name10', 'age10')][root@ip-172-31-22-86ec2-user]#

a3caa0de-0707-4816-9e37-2ca7e6a106d1.png

2.测试连接Impala

[root@ip-172-31-22-86ec2-user]# python ImpalaTest.py[('name', 'STRING', None, None, None, None, None),('comment', 'STRING', None, None, None, None, None)]

[('_impala_builtins', 'Systemdatabase for Impala builtin functions'),('default', 'Default Hive database')]

[('s1', 'STRING', None, None, None,None, None),('s2', 'STRING', None, None, None,None, None)]

[('name1', 'age1'),('name2', 'age2'),('name3', 'age3'),('name4', 'age4'),('name5', 'age5'),('name6', 'age6'),('name7', 'age7'),('name8', 'age8'),('name9', 'age9'),('name10', 'age10')][root@ip-172-31-22-86ec2-user]#

de6c64f0-5ae7-45d9-b601-0dbdc5344df7.png

5.常见问题

1.错误一

building'sasl.saslwrapper'extensioncreatingbuild/temp.linux-x86_64-2.7creatingbuild/temp.linux-x86_64-2.7/saslgcc-pthread -fno-strict-aliasing -g -O2 -DNDEBUG -g -fwrapv -O3 -Wall -Wstrict-prototypes -fPIC -Isasl -I/opt/cloudera/parcels/Anaconda/include/python2.7 -c sasl/saslwrapper.cpp -o build/temp.linux-x86_64-2.7/sasl/saslwrapper.ounableto execute'gcc': No such file or directoryerror:command'gcc'failed with exit status1----------------------------------------

Command"/opt/cloudera/parcels/Anaconda/bin/python -u -c "import setuptools, tokenize;__file__='/tmp/pip-build-kD6tvP/sasl/setup.py';f=getattr(tokenize,'open',open)(__file__);code=f.read().replace('\r\n','\n');f.close();exec(compile(code,__file__,'exec'))" install --record /tmp/pip-WJFNeG-record/install-record.txt --single-version-externally-managed --compile"failed with error code1in/tmp/pip-build-kD6tvP/sasl/

解决方法:

[root@ip-172-31-22-86ec2-user]# yum -y install gcc[root@ip-172-31-22-86ec2-user]# yum install gcc-c++

2.错误二

gcc-pthread -fno-strict-aliasing -g -O2 -DNDEBUG -g -fwrapv -O3 -Wall -Wstrict-prototypes -fPIC -Isasl -I/opt/cloudera/parcels/Anaconda/include/python2.7 -c sasl/saslwrapper.cpp -o build/temp.linux-x86_64-2.7/sasl/saslwrapper.occ1plus:warning: command line option ‘-Wstrict-prototypes’isvalidforC/ObjC but notforC++ [enabled by default]Infile included from sasl/saslwrapper.cpp:254:0:sasl/saslwrapper.h:22:23:fatal error: sasl/sasl.h: No such file or directory#include ^

compilationterminated.error:command'gcc'failed with exit status1

解决方法:

[root@ip-172-31-22-86ec2-user]# yum -y install python-devel.x86_64 cyrus-sasl-devel.x86_64

醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!挚友不肯放,数据玩的花!

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

您可能还想看

推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。

ecd499e3-f5ee-4daf-9bb7-b3db0f4305f5.gif

原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操



推荐阅读
  • 使用Python在SAE上开发新浪微博应用的初步探索
    最近重新审视了新浪云平台(SAE)提供的服务,发现其已支持Python开发。本文将详细介绍如何利用Django框架构建一个简单的新浪微博应用,并分享开发过程中的关键步骤。 ... [详细]
  • 如何配置Unturned服务器及其消息设置
    本文详细介绍了Unturned服务器的配置方法和消息设置技巧,帮助用户了解并优化服务器管理。同时,提供了关于云服务资源操作记录、远程登录设置以及文件传输的相关补充信息。 ... [详细]
  • DNN Community 和 Professional 版本的主要差异
    本文详细解析了 DotNetNuke (DNN) 的两种主要版本:Community 和 Professional。通过对比两者的功能和附加组件,帮助用户选择最适合其需求的版本。 ... [详细]
  • 2023年京东Android面试真题解析与经验分享
    本文由一位拥有6年Android开发经验的工程师撰写,详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]
  • 本文介绍了如何利用npm脚本和concurrently工具,实现本地开发环境中多个监听服务的同时启动,包括HTTP服务、自动刷新、Sass和ES6支持。 ... [详细]
  • 使用C#开发SQL Server存储过程的指南
    本文介绍如何利用C#在SQL Server中创建存储过程,涵盖背景、步骤和应用场景,旨在帮助开发者更好地理解和应用这一技术。 ... [详细]
  • UNP 第9章:主机名与地址转换
    本章探讨了用于在主机名和数值地址之间进行转换的函数,如gethostbyname和gethostbyaddr。此外,还介绍了getservbyname和getservbyport函数,用于在服务器名和端口号之间进行转换。 ... [详细]
  • 本文详细分析了Hive在启动过程中遇到的权限拒绝错误,并提供了多种解决方案,包括调整文件权限、用户组设置以及环境变量配置等。 ... [详细]
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • Python实现照片磨皮效果
    本文介绍如何使用Python和OpenCV库来实现照片的磨皮效果,使图片更加平滑并提升整体美感。 ... [详细]
  • 基于KVM的SRIOV直通配置及性能测试
    SRIOV介绍、VF直通配置,以及包转发率性能测试小慢哥的原创文章,欢迎转载目录?1.SRIOV介绍?2.环境说明?3.开启SRIOV?4.生成VF?5.VF ... [详细]
  • 本题通过将每个矩形视为一个节点,根据其相对位置构建拓扑图,并利用深度优先搜索(DFS)或状态压缩动态规划(DP)求解最小涂色次数。本文详细解析了该问题的建模思路与算法实现。 ... [详细]
  • 本文探讨了MariaDB在当前数据库市场中的地位和挑战,分析其可能面临的困境,并提出了对未来发展的几点看法。 ... [详细]
  • 最近团队在部署DLP,作为一个技术人员对于黑盒看不到的地方还是充满了好奇心。多次咨询乙方人员DLP的算法原理是什么,他们都以商业秘密为由避而不谈,不得已只能自己查资料学习,于是有了下面的浅见。身为甲方,虽然不需要开发DLP产品,但是也有必要弄明白DLP基本的原理。俗话说工欲善其事必先利其器,只有在懂这个工具的原理之后才能更加灵活地使用这个工具,即使出现意外情况也能快速排错,越接近底层,越接近真相。根据DLP的实际用途,本文将DLP检测分为2部分,泄露关键字检测和近似重复文档检测。 ... [详细]
  • 本文探讨了如何在 PHP 的 Eloquent ORM 中实现数据表之间的关联查询,并通过具体示例详细解释了如何将关联数据嵌入到查询结果中。这不仅提高了数据查询的效率,还简化了代码逻辑。 ... [详细]
author-avatar
紫陌
这个世界上真的有天使的存在吗
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有