当前位置: 开发笔记 > 编程语言 > 正文

Ambari2.7+HDP3.0.1Spark读取Hive数据

作者：心如止水向北飞2012_737 | 来源：互联网 | 2023-09-05 10:35

凡事预则立不预则废点击上方\x26quot;Python大数据与SQL优化笔记\x26quot;关注我们哦点击关注有惊

凡事预则立不预则废

点击上方"Python大数据与SQL优化笔记"关注我们哦

点击关注有惊喜大礼包送给你哦！~

下面说说Ambari2.7+HDP3.0.1 Spark读取Hive数据设置的一些坑，因为最近有人遇到和我同意的问题，所以这里记录下，希望如果有人用和我一样的大数据环境，别再踩这个坑。

Spark Shell下访问Hive的database/table，需要注意2个Spark配置项：

(1) hive.metastore.uris

配置为： thrift://xxxxx:9083

(2) metastore.catalog.default

配置为：Hive

这个选项默认为Spark，即读取SparkSQL自己的metastore_db，修改完后，Spark Shell会去读取Hive的metastore，这样就可以实现以Spark Shell方式访问Hive SQL方式创建的databases/tables.

hive表读取报错，需要关闭Hive 的ACID，disable transactional 模式。

建表的时候要加一个选择。如下：

create table xxx.***(....) stored as orc TBLPROPERTIES('transactional'='false')

https://cwiki.apache.org/confluence/display/Hive/Hive+Transactions#HiveTransactions-Transaction/LockManager

Ambari Group	Detail property	backend config parameter	config parameter value
Advanced hive-site	Use Locking	hive.support.concurrency	false
Custom hiveserver2-site	hive.enforce.bucketing	hive.enforce.bucketing	false
General	Allow All Partitions to be Dynamic	hive.exec.dynamic.partition.mode	nonstrict
General	Transaction Manager	hive.txn.manager	org.apache.hadoop.hive.ql.lockmgr.DummyTxnManager
General & Advanced hivemetastore-site	Run Compactor	hive.compactor.initiator.on	off
General & Advanced hivemetastore-site	Number of Threads Used by Compactor	hive.compactor.worker.threads	0
Advanced hive-interactive-site & advanced hive-site	hive.strict.managed.tables	hive.strict.managed.tables	false

sc = SparkContext()
SparkContext.setSystemProperty("hive.metastore.uris", "thrift://localhost:9083")
sparkSession = (SparkSession
                .builder
                .appName('xxx')
                .master('yarn')
                .config('spark.submit.deployMode', 'cluster')
                .config('spark.eventLog.enabled', 'false')
                .enableHiveSupport()
                .getOrCreate())

spark SQL的使用方式还是不变

sparkSession.sql(xxxxxxx)

------------------------------------------------------------------------------------

福利

扫描加群，学习

推荐阅读

text
CentOS7通过RealVNC实现多人使用服务器桌面

背景：公司研发团队通过VNC登录到CentOS服务器的桌面实现软件开发工作为防止数据外泄，需要在RealVNC设置禁止传输文件、访问粘贴板等策略过程&# ... [详细]

蜡笔小新 2024-11-18 09:22:21
spring
探索阿里巴巴的开源世界

从理想主义者的内心深处萌发的技术信仰，推动了云原生技术在全球范围内的快速发展。本文将带你深入了解阿里巴巴在开源领域的贡献与成就。 ... [详细]

蜡笔小新 2024-11-21 09:06:54
uri
设计无SQL死锁的编码模式 - Achieving SQL Deadlock-Free Design

在运行于MS SQL Server 2005的.NET 2.0 Web应用中，我偶尔会遇到令人头疼的SQL死锁问题。过去，我们主要通过调整查询来解决这些问题，但这既耗时又不可靠。我希望能找到一种确定性的查询模式，确保从设计上彻底避免SQL死锁。 ... [详细]

蜡笔小新 2024-11-16 13:09:51
uri
JUnit下的测试和suite

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2024-11-21 16:03:49
text
spring boot使用jetty无法启动

spring boot使用jetty无法启动 ... [详细]

蜡笔小新 2024-11-21 10:15:52
uri
CentOS下ProFTPD的安装与配置指南

本文详细介绍在CentOS操作系统上安装和配置ProFTPD服务的方法，包括基本配置、安全设置及高级功能的启用。 ... [详细]

蜡笔小新 2024-11-21 09:45:56
config
深入体验Python的高级交互式Shell - IPython

IPython 是一个增强型的 Python 交互式 Shell，提供了比标准 Python 控制台更为强大的功能，适用于开发和调试过程。它不仅支持直接执行 Linux 命令，还提供了丰富的特性来提高编程效率。 ... [详细]

蜡笔小新 2024-11-20 19:06:56
text
解决PHP及Web开发中的UTF-8乱码问题

本文详细探讨了在Web开发中常见的UTF-8编码问题及其解决方案，包括HTML页面、PHP脚本、MySQL数据库以及JavaScript和Flash应用中的乱码问题。 ... [详细]

蜡笔小新 2024-11-20 10:58:03
schema
解决SQL Server 2008中删除带有架构所有权的用户问题

本文探讨了在SQL Server 2008环境下，当尝试删除拥有数据库架构的用户时遇到的问题及解决方案，包括如何查询和更改架构所有权。 ... [详细]

蜡笔小新 2024-11-19 19:05:35
export
Kafka入门指南

本文将详细介绍如何在CentOS 7上安装和配置Kafka，包括必要的环境准备、JDK和Zookeeper的配置步骤。 ... [详细]

蜡笔小新 2024-11-18 17:41:13
char
Django与Python及其他Web框架的对比

本文详细介绍了Django与其他Python Web框架（如Flask和Tornado）的区别，并探讨了Django的基本使用方法及与其他语言（如PHP）的比较。 ... [详细]

蜡笔小新 2024-11-18 09:13:53
dll
Oracle 10g 和 11g 32位 OCI.DLL 文件下载

32位 PL/SQL Developer 访问 64位 Oracle 11g 数据库时，需要使用 32位的 OCI.DLL 文件以确保正常连接和数据访问。本文将详细介绍如何获取并配置此文件。 ... [详细]

蜡笔小新 2024-11-17 20:10:35
dll
Ubuntu 环境下配置 LAMP 服务器

本文详细介绍了如何在 Ubuntu 系统上安装和配置 LAMP（Linux、Apache、MySQL 和 PHP）服务器。包括 Apache 的安装、PHP 的配置以及 MySQL 数据库的设置，确保读者能够顺利搭建完整的 Web 开发环境。 ... [详细]

蜡笔小新 2024-11-17 11:05:00
text
解决网页乱码问题的实用方法

网页乱码问题在开发中较为常见，主要由文件编码、程序字符集设置和数据库连接字符集设置不当引起。本文将详细介绍如何逐一排查并解决这些问题。 ... [详细]

蜡笔小新 2024-11-16 19:06:29
uri
Oracle SQL 第二天

本文介绍了 Oracle SQL 中的集合运算、子查询、数据处理、表的创建与管理等内容。包括查询部门号为10和20的员工信息、使用集合运算、子查询的注意事项、数据插入与删除、表的创建与修改等。 ... [详细]

蜡笔小新 2024-11-16 16:43:29

心如止水向北飞2012_737

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章