sparkhive结合杂记

作者：Edwin | 来源：互联网 | 2023-10-10 13:17

1.下载spark源码，在spark源码目录下面有个make-distribution.sh文件，修改里面的参数，使编译后能支持hive，修改后执行该文件。（要预先安装好maven

1.下载spark源码，在spark源码目录下面有个make-distribution.sh文件，修改里面的参数，使编译后能支持hive，修改后执行该文件。（要预先安装好maven才能编译）。

2.将编译好的spark源码部署到机器上，然后将hive/conf中的hive-site.xml拷贝到spark/conf目录下。然后可以通过spark-shell来测试一下，详见：http://www.cnblogs.com/hseagle/p/3758922.html

3.spark中使用hive要时，要启动hive server服务，在hive/bin目录下建立一个脚步文件，添加 chmod u+x filename

nohup ./hive --service hiveserver >> hiveserver.log 2>&1 &
echo $! > hive-server.pid

4.在eclipse中编写spark程序时，要将spark/lib中的包倒入，spark-examples。。。.jar不用导入。如果要操作hive可能还要倒入对应的数据库jdbc驱动。

5.在eclipse中直接运行java 版的spark hive程序时可能会会先hive的metastore不正确的，而是链接的默认metastore此时就会出现各种错误eg.no table TABLENAME, can‘t fetch table ...，类似的错误，我的解决办法是，将java程序打包成jar，将导出的jar包拷贝到spark/lib目录下。,然后通过参考spark/bin中的spark-submit脚本命令来执行jar程序，参考spark/bin/run-examples脚步，做了如下简化，测试后可以进行简单的无参数输入执行：

SCALA_VERSION=2.10

FWDIR="$(cd `dirname $0`/..; pwd)"
export SPARK_HOME="$FWDIR"
export SPARK_EXAMPLES_JAR=$SPARK_HOME/lib/YOUR_EXPORT_JAR_NAME.jar
EXAMPLE_MASTER=${MASTER:-"local[*]"}
EXAMPLE_CLASS=demo.wrencai.cup.SparkHiveDemo

"$FWDIR"/bin/spark-submit   --master $EXAMPLE_MASTER   --class $EXAMPLE_CLASS   --name SparkSubmit_Demo   "$SPARK_EXAMPLES_JAR" \

注意：上面的脚本中需要修改蓝色标注的两行，将红色字体分别改成你所导出的jar包名和你要执行的类名g（格式：YourPacketName.YourClassName）

spark hive结合杂记

推荐阅读

config
探索OpenWrt中的LuCI框架

本文深入探讨了OpenWrt系统中轻量级HTTP服务器uhttpd的工作原理及其配置，重点介绍了LuCI界面的实现机制。 ... [详细]

蜡笔小新 2024-11-24 20:29:37
post
深入理解PHP中的超全局变量与AJAX技术

本文详细介绍了PHP中的几种超全局变量，包括$GLOBAL、$_SERVER、$_POST、$_GET等，并探讨了AJAX的工作原理及其优缺点。通过具体示例，帮助读者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-11-24 16:35:09
config
GNU/Linux系统中动态库搜索路径的指定与管理

本文概述了在GNU/Linux系统中，动态库在链接和运行阶段的搜索路径及其指定方法，包括通过编译时参数、环境变量及系统配置文件等方式来控制动态库的查找路径。 ... [详细]

蜡笔小新 2024-11-24 15:56:16
config
使用REM和媒体查询实现响应式布局

本文介绍如何利用REM单位和媒体查询（Media Queries）来创建适应不同屏幕尺寸的网页布局。通过具体示例，展示在不同屏幕宽度下如何调整页面元素的样式。 ... [详细]

蜡笔小新 2024-11-24 12:50:22
spring
Windows环境下Oracle数据库迁移实践

本文详细记录了一次在Windows操作系统下将Oracle数据库的控制文件、数据文件及在线日志文件迁移至外部存储的过程，旨在为后续的集群环境部署做好准备。 ... [详细]

蜡笔小新 2024-11-23 19:57:51
controller
egg实现登录鉴权（七）：权限管理

权限管理包含三部分：访问页面的权限，操作功能的权限和获取数据权限。页面权限：登录用户所属角色的可访问页面的权限功能权限：登录用户所属角色的可访问页面的操作权限数据权限：登录用户所属 ... [详细]

蜡笔小新 2024-11-23 16:30:15
controller
使用 ModelAttribute 实现页面数据自动填充

本文介绍了如何利用 Spring MVC 中的 ModelAttribute 注解，在页面跳转后自动填充表单数据。主要探讨了两种实现方法及其背后的原理。 ... [详细]

蜡笔小新 2024-11-24 12:55:24
controller
SPFA算法详解与应用

当图中包含负权边时，传统的最短路径算法如Dijkstra不再适用，而Bellman-Ford算法虽然能解决问题，但其时间复杂度过高。SPFA算法作为一种改进的Bellman-Ford算法，能够在多数情况下提供更高效的解决方案。本文将详细介绍SPFA算法的原理、实现步骤及其应用场景。 ... [详细]

蜡笔小新 2024-11-24 12:40:02
controller
深入解析HashMap与HashTable的区别

本文详细对比了HashMap和HashTable在多线程环境下的安全性、对null值的支持、性能表现以及方法同步等方面的特点，帮助开发者根据具体需求选择合适的数据结构。 ... [详细]

蜡笔小新 2024-11-24 12:24:40
controller
神策数据分析基础

本文介绍了基于用户行为的数据分析方法，包括业务问题的提出与定义、具体行为的识别及统计分析流程。同时，详细阐述了如何利用事件模型（Event Model）来描述用户行为，以及在实际应用中的案例分析。 ... [详细]

蜡笔小新 2024-11-24 11:18:50
controller
Docker基础入门与环境配置指南

本文介绍了Docker——一款用Go语言编写的开源应用程序容器引擎。通过Docker，用户能够将应用及其依赖打包进容器内，实现高效、轻量级的虚拟化。容器之间采用沙箱机制，确保彼此隔离且资源消耗低。 ... [详细]

蜡笔小新 2024-11-24 09:54:53
import
selenium通过JS语法操作页面元素

做过web测试的小伙伴们都知道，web元素现在很多是JS写的，那么既然是JS写的，可以通过JS语言去操作页面，来帮助我们操作一些selenium不能覆盖的功能。问题来了我们能否通过 ... [详细]

蜡笔小新 2024-11-24 03:05:20
include
AOJ1024 清洁机器人2.0

本文介绍了一个来自AIZU ONLINE JUDGE平台的问题，即清洁机器人2.0。该问题来源于某次编程竞赛，涉及复杂的算法逻辑与实现技巧。 ... [详细]

蜡笔小新 2024-11-23 17:16:33
include
iOS开发中的UIView及其子类应用

本文介绍了用户界面（User Interface, UI）的基本概念，以及在iOS应用程序中UIView及其子类的重要性和使用方式。文章详细探讨了UIView如何作为用户交互的核心组件，以及它与其他UI控件和业务逻辑的关系。 ... [详细]

蜡笔小新 2024-11-23 16:25:09
include
线性表中的元素删除算法

本文探讨了线性表中元素的删除方法，包括顺序表和链表的不同实现策略，以及这些策略在实际应用中的性能分析。 ... [详细]

蜡笔小新 2024-11-23 16:14:36

Edwin

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章