首页技术博客 PHP教程数据库技术前端开发 HTML5 Nginx php论坛

新用户注册 | 会员登录

热门标签 | HotTags

当前位置: 开发笔记 > 编程语言 > 正文

Ranger、LLAP管理SparkSQL权限配置

作者：Dr_H-鄧 | 来源：互联网 | 2023-09-11 08:17

概述之前一直使用ranger管理hive的用户权限，现在系统要集成SparkSQL(thriftserver)，但是在ranger下并没有SparkSQL的相关的插件，通过搜集HO

概述

之前一直使用ranger管理hive的用户权限，现在系统要集成SparkSQL(thriftserver)，但是在ranger下并没有SparkSQL的相关的插件，通过搜集HORTONWORKS相关资料，可以给SparkSQL配置LLAP（关于LLAP的更多细节，查看https://cwiki.apache.org/confluence/display/Hive/LLAP），然后通过ranger的hive policy间接支持SparkSQL的用户权限管理。

2. 原理

《Ranger、LLAP管理SparkSQL权限配置》
图-1

如图-1所示：

1）、SparkSQL接收到sql语句后，将该语句提交给HiveServer2

2）、Ranger 通过hive插件检查access policy，并告诉SparkSQL访问哪些表（列）不能访问哪些表（列）

3）、SparkSQL开始尝试通过LLAP从hdfs读取数据

4）、LLAP收到请求，检测到请求中包含没有权限访问的列，就停止处理该请求，同时返回一个权限异常给Spark

3. 配置

环境

1）、HDP-2.6.3.0-235 with Spark2，non-kerberized 集群

2）、SPARK-LLAP：集群内部集成

配置Hiveserver2 Interactive 服务

在Ambari中，定位到hive服务配置页，并且点击Enable Interactive Query:

《Ranger、LLAP管理SparkSQL权限配置》

随后会跳出相关配置，这些配置和LLAP服务资源分配有关，可以保持默认，因为目前只是为了满足测试需要。

《Ranger、LLAP管理SparkSQL权限配置》

保存配置，确认，继续。

重启影响的服务。

定位到service summary tab页面，确保Hiveserver2 Interactive服务启动成功：

《Ranger、LLAP管理SparkSQL权限配置》

配置Spark2

在Ambari中，定位到spark2配置页

《Ranger、LLAP管理SparkSQL权限配置》
spark2配置页

找到 Custom spark2-defaults，

点击 add property 并添加如下属性：

spark.sql.hive.hiveserver2.jdbc.url= jdbc:hive2://{hiveserver-interactive-hostname}:10500/

spark.hadoop.hive.llap.daemon.service.hosts=@llap0

spark.hadoop.hive.zookeeper.quorum={some-or-all-zookeeper-hostnames}:2181

找到 Custom spark2-thrift-sparkconf，

点击 add property 并添加和 Custom spark2-defaults相同的属性

找到 Advanced spark2-env，

给属性spark_thrift_cmd_opts设置值：&＃8211;jars /usr/hdp/2.6.3.0-235/spark_llap/spark-llap-assembly-1.0.0.2.6.3.0-235.jar &＃8211;conf spark.sql.hive.llap=true

《Ranger、LLAP管理SparkSQL权限配置》

注：在HDP-2.6.3已经内部集成了spark-llap，对于没有集成spark-llap的HDP版本，spark_thrift_cmd_opts值应该这样设置值：&＃8211;packages com.hortonworks.spark:spark-llap-assembly_2.11:1.1.3-2.1 &＃8211;repositories http://repo.hortonworks.com/content/groups/public/ &＃8211;conf spark.sql.hive.llap=true

保存属性修改，然后重启影响的服务，完成。

测试

1）、给默认database设置ranger权限（推荐）

《Ranger、LLAP管理SparkSQL权限配置》

之所以推荐这样设置是，因为连接ThriftServer的时候一般是jdbc:hive2://{thriftserver-host}:{thriftserver-port}，如果没有登录default的权限，连接时将直接拒绝，更谈不上执行更多的任务。

2）、测试

我的hive中现有3个库：

《Ranger、LLAP管理SparkSQL权限配置》

而用户**15698只对***_data_service有权限：

《Ranger、LLAP管理SparkSQL权限配置》

现在用用户**15698连接ThriftServer，只显示***_data_service库:

《Ranger、LLAP管理SparkSQL权限配置》

执行explain select，已经开始走LLAP权限验证：

《Ranger、LLAP管理SparkSQL权限配置》

测试完成。

4. 参考资料

hortonworks-spark/spark-llap github.com 《Ranger、LLAP管理SparkSQL权限配置》
Error:&＃8221;Unable to instantiate SparkSession with LLAP support because LLAP or Hive classes are not found&＃8221; after upgrading from HDP 2.6.2 to 2.6.3 when starting Spark2 Thirft Server &＃8211; Hortonworks community.hortonworks.com
SparkSQL, Ranger, and LLAP via Spark Thrift Server for BI scenarios to provide row, column level security, and masking &＃8211; Hortonworks zh.hortonworks.com 《Ranger、LLAP管理SparkSQL权限配置》

推荐阅读

command
Windows服务与数据库交互问题解析

本文探讨了在Windows 10（64位）环境下开发的Windows服务，旨在定期向本地MS SQL Server (v.11)插入记录。尽管服务已成功安装并运行，但记录并未正确插入。我们将详细分析可能的原因及解决方案。 ... [详细]

蜡笔小新 2024-12-28 10:30:14
buffer
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
case
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
js
深入理解OAuth认证机制

本文介绍了OAuth认证协议的核心概念及其工作原理。OAuth是一种开放标准，旨在为第三方应用提供安全的用户资源访问授权，同时确保用户的账户信息（如用户名和密码）不会暴露给第三方。 ... [详细]

蜡笔小新 2024-12-28 12:07:46
format
HDFS与Hive中的数据存储和管理机制

本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射，详细解释了两者的创建、加载及删除操作，并提供了查看表详细信息的方法。通过对比这两种表类型，帮助读者理解如何更好地管理和保护数据。 ... [详细]

蜡笔小新 2024-12-27 20:21:48
command
深入理解设计模式与七大原则

本文详细探讨了Java中的24种设计模式及其应用，并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类，帮助开发者更好地理解和应用这些模式，提升代码质量和可维护性。 ... [详细]

蜡笔小新 2024-12-27 19:10:10
import
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
install
Linux 自动化安装脚本详解

本文介绍了一款用于自动化部署 Linux 服务的 Bash 脚本。该脚本不仅涵盖了基本的文件复制和目录创建，还处理了系统服务的配置和启动，确保在多种 Linux 发行版上都能顺利运行。 ... [详细]

蜡笔小新 2024-12-27 16:33:32
const
深入解析Spring Cloud Ribbon负载均衡机制

本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式，帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]

蜡笔小新 2024-12-27 16:01:25
const
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
web
DNN Community 和 Professional 版本的主要差异

本文详细解析了 DotNetNuke (DNN) 的两种主要版本：Community 和 Professional。通过对比两者的功能和附加组件，帮助用户选择最适合其需求的版本。 ... [详细]

蜡笔小新 2024-12-27 13:14:08
include
UNP 第9章：主机名与地址转换

本章探讨了用于在主机名和数值地址之间进行转换的函数，如gethostbyname和gethostbyaddr。此外，还介绍了getservbyname和getservbyport函数，用于在服务器名和端口号之间进行转换。 ... [详细]

蜡笔小新 2024-12-27 11:26:39
include
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
split
解析Java中Text.splitText()方法及其应用场景

本文详细介绍了Java中org.w3c.dom.Text类的splitText()方法，通过多个代码示例展示了其实际应用。该方法用于将文本节点在指定位置拆分为两个节点，并保持在文档树中。 ... [详细]

蜡笔小新 2024-12-26 18:31:42
stream
优化Kafka流状态存储查询的最佳实践

本文探讨了如何优化和正确配置Kafka Streams应用程序以确保准确的状态存储查询。通过调整配置参数和代码逻辑，可以有效解决数据不一致的问题。 ... [详细]

蜡笔小新 2024-12-26 18:17:14

Dr_H-鄧

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved |

京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区版权所有