当前位置: 开发笔记 > 编程语言 > 正文

回顾IDEA开发SparkSQL基础编程

作者：不可能爱你啊 | 来源：互联网 | 2023-08-26 15:09

篇首语：本文由编程笔记#小编为大家整理，主要介绍了回顾IDEA开发SparkSQL基础编程相关的知识，希望对你有一定的参考价值。

篇首语：本文由编程笔记#小编为大家整理，主要介绍了回顾IDEA 开发 SparkSQL 基础编程相关的知识，希望对你有一定的参考价值。

文章目录

1、添加依赖
2、代码实现
- 2.1 构建环境
- 2.2 DataFrame的创建
- 2.3 DataSet的创建
- 2.4 RDD & DataFrame
- 2.5 RDD & DataSet
- 2.5 DataFrame & DataSet

1、添加依赖

当前热门的开发编辑器当属 IDEA 了&＃xff0c;接下来介绍一下在该款开发工具中的使用。

首先我们需要为Spark-SQL模块导入依赖&＃xff1a;

<dependency> <groupId>org.apache.sparkgroupId> <artifactId>spark-sql_2.11artifactId> <version>2.2.0version> dependency>

在原有的pom.xml的基础上更新一下即可&＃xff01;(完整配置连接如下&＃xff0c;永久有效哦)&＃x1f60e;&＃x1f60e;&＃x1f60e;

提取连接&＃xff1a; https://pan.baidu.com/s/1o1px2DBN5AEWDtouxlUhRw
提取码&＃xff1a;eirr

2、代码实现

2.1 构建环境

不同于spark-core&＃xff0c;在其基础之上&＃xff0c;spark-sql内置封装了新的入口SparkSession。起初&＃xff0c;SparkSQL创建了两个入口&＃xff1a;SQLContext、HiveContext。之后为了解决入口不统一的问题&＃xff0c;创建了一个新的入口节点 — SparkSession&＃xff0c;作为整个Spark生态工具的统一入口节点&＃xff0c;包括了SQLContext、HiveContext、SparkContext等组建的功能。

注意&＃xff1a;

SparkSession的创建需要借助伴生类的Builder()进行创建&＃xff0c;因为原始的SparkSession是私有封装&＃xff0c;外部无法直接访问。

object Spark01_sql_test def main(args: Array[String]): Unit &＃61; // TODO: 创建sparkSession的运行环境 val conf &＃61; new SparkConf().setMaster("local[*]").setAppName("test") val spark &＃61; new SparkSession.Builder().config(conf).getOrCreate() // TODO:逻辑操作 ...... // TODO:关闭资源 spark.stop()

返回顶部

2.2 DataFrame的创建

1、构建json数据文件

"username":"张三","age": 25,"sex":"男" "username":"李四","age": 23,"sex":"男" "username":"王五","age": 24,"sex":"女" "username":"赵六","age": 22,"sex":"男"

2、获取数据

通过spark.read从文件中获取的数据集会被自动保存为DataFrame类型的数据。

val df: DataFrame &＃61; spark.read.json("data/user.json") df.show()

3、SQL语法

在创建好数据的视图表之后&＃xff0c;直接使用spark.sql执行sql语句

println("************SQL*************") // SQL df.createOrReplaceGlobalTempView("user") spark.sql("select * from global_temp.user").show()

4、DSL语法

使用spark封装的 sql 语法API进行具体操作
注意要导入隐式转换&＃xff1a;import spark.implicits._

println("************DSL*************") // DSL import spark.implicits._ // 隐式转换 df.select(&＃39;username,$"age",&＃39;sex).show()

返回顶部

2.3 DataSet的创建

// TODO:DataSet val seq &＃61; Seq(1,2,3) val ds &＃61; seq.toDS() ds.show()

查看底层可以知道&＃xff1a;type DataFrame &＃61; Dataset[Row]&＃xff0c;也就是DataFrame是DataSet指定类型的一种数据对象&＃xff0c;所以DataFrame适用的方法DataSet也均适用。

返回顶部

2.4 RDD & DataFrame

// TODO:RDD <&＃61;> DataFrame // 创建rdd val rdd: RDD[(Int, String, Int)] &＃61; spark.sparkContext.makeRDD( List( (1,"zhangsan",30),(2,"lisi",25),(3,"wangwu",40) ) ) // toDF 转为 DataFrame val df: DataFrame &＃61; rdd.toDF("id","name","age") df.show() // df.rdd 转为 rdd&＃xff1a;RDD[Row] val backRDD: RDD[Row] &＃61; df.rdd backRDD.collect().foreach(println)

返回顶部

2.5 RDD & DataSet

// TODO:RDD <&＃61;> DataSet // 创建RDD val rdd: RDD[(Int, String, Int)] &＃61; spark.sparkContext.makeRDD( List( (1, "zhangsan", 30), (2, "lisi", 25), (3, "wangwu", 40) ) ) // 转换RDD的数据类型 val mapRDD: RDD[user] &＃61; rdd.map case (id, name, age) &＃61;> user(id, name, age) // toDS 转为 DataSet val toDS: Dataset[user] &＃61; mapRDD.toDS() toDS.show() // ds.rdd 转为 rdd val backRDD &＃61; toDS.rdd backRDD.collect().foreach(println)

返回顶部

2.5 DataFrame & DataSet

DataFrame 转换为 DataSet 需要给出明确的数据结构类型信息&＃xff0c;这里我们创建user样例类作为DataFrame的数据结构类型补充。

// 样例类 case class user(id:Int,username:String,age:Int) // TODO:DataFrame <&＃61;> DataSet val ds: Dataset[user] &＃61; df.as[user] val backDF: DataFrame &＃61; ds.toDF()

返回顶部

推荐阅读

ip
com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例

com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 10:47:33
text
开发技巧：在Interface Builder中实现UIButton文本居中对齐的方法与步骤

开发技巧：在Interface Builder中实现UIButton文本居中对齐的方法与步骤 ... [详细]

蜡笔小新 2024-11-11 17:13:04
request
利用Struts1构建简易计算器：采用DispatchAction处理请求，动态Form优化开发流程，提供用户友好的错误提示

本文介绍了如何利用Struts1框架构建一个简易的四则运算计算器。通过采用DispatchAction来处理不同类型的计算请求，并使用动态Form来优化开发流程，确保代码的简洁性和可维护性。同时，系统提供了用户友好的错误提示，以增强用户体验。 ... [详细]

蜡笔小新 2024-11-09 19:48:22
ip
javax.mail.search.BodyTerm.matchPart()方法的使用及代码示例

javax.mail.search.BodyTerm.matchPart()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 15:24:50
ip
Flutter 2.* 路由管理详解

本文详细介绍了 Flutter 2.* 中的路由管理机制，包括路由的基本概念、MaterialPageRoute 的使用、Navigator 的操作方法、路由传值、命名路由及其注册、路由钩子等。 ... [详细]

蜡笔小新 2024-11-13 13:45:49
instance
Spring – Bean Life Cycle

Spring – Bean Life Cycle ... [详细]

蜡笔小新 2024-11-13 13:24:40
ip
Android 自定义加载对话框 CustomProgressDialog

本文介绍如何在 Android 中自定义加载对话框 CustomProgressDialog，包括自定义 View 类和 XML 布局文件的详细步骤。 ... [详细]

蜡笔小新 2024-11-12 21:51:00
ip
c/c++常用代码doc,ppt,xls文件格式转PDF格式[转]

[转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]

蜡笔小新 2024-11-12 16:19:40
instance
Spring详解（六）AOP

原文网址：https:www.cnblogs.comysoceanp7476379.html目录1、AOP什么？2、需求3、解决办法1:使用静态代理4 ... [详细]

蜡笔小新 2024-11-12 14:40:40
format
基于Net Core 3.0与Web API的前后端分离开发：Vue.js在前端的应用

本文介绍了如何使用Net Core 3.0和Web API进行前后端分离开发，并重点探讨了Vue.js在前端的应用。后端采用MySQL数据库和EF Core框架进行数据操作，开发环境为Windows 10和Visual Studio 2019，MySQL服务器版本为8.0.16。文章详细描述了API项目的创建过程、启动步骤以及必要的插件安装，为开发者提供了一套完整的开发指南。 ... [详细]

蜡笔小新 2024-11-11 10:58:21
text
Android TextView：实现多彩文字与多样化字体效果

在探讨如何在Android的TextView中实现多彩文字与多样化字体效果时，本文提供了一种不依赖HTML技术的解决方案。通过使用SpannableString和相关的Span类，开发者可以轻松地为文本添加丰富的样式和颜色，从而提升用户体验。文章详细介绍了实现过程中的关键步骤和技术细节，帮助开发者快速掌握这一技巧。 ... [详细]

蜡笔小新 2024-11-10 15:37:21
text
C#编程指南：实现流畅用户界面的设计技巧与方法分享

在C#编程中，设计流畅的用户界面是一项重要的任务。本文分享了实现Fluent界面设计的技巧与方法，特别是通过编写领域特定语言（DSL）来简化字符串操作。我们探讨了如何在不使用`+`符号的情况下，通过方法链式调用来组合字符串，从而提高代码的可读性和维护性。文章还介绍了如何利用静态方法和扩展方法来实现这一目标，并提供了一些实用的示例代码。 ... [详细]

蜡笔小新 2024-11-10 13:37:55
instance
自定义 Android 圆形进度条视图，支持显示数字和中心文字

本文介绍了一种自定义的Android圆形进度条视图，支持在进度条上显示数字，并在圆心位置展示文字内容。通过自定义绘图和组件组合的方式实现，详细展示了自定义View的开发流程和关键技术点。示例代码和效果展示将在文章末尾提供。 ... [详细]

蜡笔小新 2024-11-10 13:04:42
text
Unity3D 中 AsyncOperation 实现异步场景加载及进度显示优化技巧

在Unity3D中，通过使用`AsyncOperation`可以实现高效的异步场景加载，并结合进度条显示来提升用户体验。本文详细介绍了如何利用`AsyncOperation`进行异步加载，并提供了优化技巧，包括进度条的动态更新和加载过程中的性能优化方法。此外，还探讨了如何处理加载过程中可能出现的异常情况，确保加载过程的稳定性和可靠性。 ... [详细]

蜡笔小新 2024-11-10 11:22:38
format
艾伟深入解析：WCF Binding模型中的绑定元素详解

本文深入解析了WCF Binding模型中的绑定元素，详细介绍了信道、信道管理器、信道监听器和信道工厂的概念与作用。从对象创建的角度来看，信道管理器负责信道的生成。具体而言，客户端的信道通过信道工厂进行实例化，而服务端则通过信道监听器来接收请求。文章还探讨了这些组件之间的交互机制及其在WCF通信中的重要性。 ... [详细]

蜡笔小新 2024-11-09 17:13:19

不可能爱你啊

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章