scala程序写Spark程序实现黑名单过滤

作者：乐橙味_367 | 来源：互联网 | 2023-09-10 15:51

packagecom.bigdataimportorg.apache.spark.rdd.RDDimportorg.apache.spark.{SparkConte

package com.bigdata

import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkContext, SparkConf}

/**
*
*/
object BlackWhite {
def main(args: Array[String]) {
createContext()(process)
}

def createContext()(func:SparkCOntext=>Unit){
val cOnf=new SparkConf().setAppName("BlackWhite").setMaster("local[2]")
val sc=new SparkContext(conf)
try{
func(sc)
}finally {
sc.stop()
}
}
//处理数据
def process(sc:SparkContext): Unit ={
val aRdd=sc.textFile("/spark/a.txt")
val bRdd=sc.textFile("/spark/b.txt")//存放用户黑名单
val a=aRdd.map(_.split(" ")).map(arr=>(arr(0),arr))
val b=bRdd.map((_,true))
val aJoinb: RDD[(String, (Array[String], Option[Boolean]))] =a.leftOuterJoin(b)
val result: RDD[(String, String)] =aJoinb.filter({
case word:(String, (Array[String], Option[Boolean]))=>word._2._2.isEmpty
}).map(abc=>(abc._2._1(0),abc._2._1(1)))
println(result.collect().mkString(" "))
}
}

推荐阅读

io
自定义 Android 圆形进度条视图，支持显示数字和中心文字

本文介绍了一种自定义的Android圆形进度条视图，支持在进度条上显示数字，并在圆心位置展示文字内容。通过自定义绘图和组件组合的方式实现，详细展示了自定义View的开发流程和关键技术点。示例代码和效果展示将在文章末尾提供。 ... [详细]

蜡笔小新 2024-11-10 13:04:42
io
使用 ListView 浏览安卓系统中的回收站文件

使用 ListView 浏览安卓系统中的回收站文件 ... [详细]

蜡笔小新 2024-11-09 16:34:55
io
分享一款基于Java开发的经典贪吃蛇游戏实现

本文介绍了一款使用Java语言开发的经典贪吃蛇游戏的实现。游戏主要由两个核心类组成：`GameFrame` 和 `GamePanel`。`GameFrame` 类负责设置游戏窗口的标题、关闭按钮以及是否允许调整窗口大小，并初始化数据模型以支持绘制操作。`GamePanel` 类则负责管理游戏中的蛇和苹果的逻辑与渲染，确保游戏的流畅运行和良好的用户体验。 ... [详细]

蜡笔小新 2024-11-08 17:59:38
io
深入解析Java多线程同步机制与应用

本文深入探讨了Java多线程环境下的同步机制及其应用，重点介绍了`synchronized`关键字的使用方法和原理。`synchronized`关键字主要用于确保多个线程在访问共享资源时的互斥性和原子性。通过具体示例，如在一个类中使用`synchronized`修饰方法，展示了如何实现线程安全的代码块。此外，文章还讨论了`ReentrantLock`等其他同步工具的优缺点，并提供了实际应用场景中的最佳实践。 ... [详细]

蜡笔小新 2024-11-08 16:11:26
io
Scala学习指南：从零开始掌握基础

本指南从零开始介绍Scala编程语言的基础知识，重点讲解了Scala解释器REPL（读取-求值-打印-循环）的使用方法。REPL是Scala开发中的重要工具，能够帮助初学者快速理解和实践Scala的基本语法和特性。通过详细的示例和练习，读者将能够熟练掌握Scala的基础概念和编程技巧。 ... [详细]

蜡笔小新 2024-11-07 18:07:59
io
深入剖析Java中SimpleDateFormat在多线程环境下的潜在风险与解决方案

深入剖析Java中SimpleDateFormat在多线程环境下的潜在风险与解决方案 ... [详细]

蜡笔小新 2024-11-09 19:04:36
io
Python 程序转换为 EXE 文件：详细解析 .py 脚本打包成独立可执行文件的方法与技巧

在开发了几个简单的爬虫 Python 程序后，我决定将其封装成独立的可执行文件以便于分发和使用。为了实现这一目标，首先需要解决的是如何将 Python 脚本转换为 EXE 文件。在这个过程中，我选择了 Qt 作为 GUI 框架，因为之前对此并不熟悉，希望通过这个项目进一步学习和掌握 Qt 的基本用法。本文将详细介绍从 .py 脚本到 EXE 文件的整个过程，包括所需工具、具体步骤以及常见问题的解决方案。 ... [详细]

蜡笔小新 2024-11-09 14:59:47
io
求助：如何使用Pull方法解析标签内容，悬赏50分求完美解决方案

在处理 XML 数据时，如果需要解析 `` 标签的内容，可以采用 Pull 解析方法。Pull 解析是一种高效的 XML 解析方式，适用于流式数据处理。具体实现中，可以通过 Java 的 `XmlPullParser` 或其他类似的库来逐步读取和解析 XML 文档中的 `` 元素。这样不仅能够提高解析效率，还能减少内存占用。本文将详细介绍如何使用 Pull 解析方法来提取 `` 标签的内容，并提供一个示例代码，帮助开发者快速解决问题。 ... [详细]

蜡笔小新 2024-11-09 11:50:14
io
如何在Java中获取当前操作系统的进程列表及其详细信息

本文探讨了如何利用Java代码获取当前本地操作系统中正在运行的进程列表及其详细信息。通过引入必要的包和类，开发者可以轻松地实现这一功能，为系统监控和管理提供有力支持。示例代码展示了具体实现方法，适用于需要了解系统进程状态的开发人员。 ... [详细]

蜡笔小新 2024-11-09 10:45:26
io
使用Maven JAR插件将单个或多个文件及其依赖项合并为一个可引用的JAR包

本文介绍了如何利用Maven中的maven-assembly-plugin插件将单个或多个Java文件及其依赖项打包成一个可引用的JAR文件。首先，需要创建一个新的Maven项目，并将待打包的Java文件复制到该项目中。通过配置maven-assembly-plugin，可以实现将所有文件及其依赖项合并为一个独立的JAR包，方便在其他项目中引用和使用。此外，该方法还支持自定义装配描述符，以满足不同场景下的需求。 ... [详细]

蜡笔小新 2024-11-09 01:59:29
io
基于CXF框架的Web服务开发详细示例

在Java Web服务开发中，Apache CXF 和 Axis2 是两个广泛使用的框架。CXF 由于其与 Spring 框架的无缝集成能力，以及更简便的部署方式，成为了许多开发者的首选。本文将详细介绍如何使用 CXF 框架进行 Web 服务的开发，包括环境搭建、服务发布和客户端调用等关键步骤，为开发者提供一个全面的实践指南。 ... [详细]

蜡笔小新 2024-11-08 18:43:17
io
Java项目中两个文件互相调用时出现函数错误，请求专业解决方案

在Java项目中，当两个文件进行互相调用时出现了函数错误。具体问题出现在 `MainFrame.java` 文件中，该文件位于 `cn.javass.bookmgr` 包下，并且导入了 `java.awt.BorderLayout` 和 `java.awt.Event` 等相关类。为了确保项目的正常运行，请求提供专业的解决方案，以解决函数调用中的错误。建议从类路径、依赖关系和方法签名等方面入手，进行全面排查和调试。 ... [详细]

蜡笔小新 2024-11-08 17:04:11
io
枚举类中enum关键字的常见应用与实践

在枚举类中，`enum`关键字具有重要的作用，本文探讨了其常见的应用场景与实践。特别指出，枚举对象必须置于枚举类的首行，否则将导致编译错误。通过具体的代码示例，详细解析了这一规则及其背后的原理，帮助开发者更好地理解和使用枚举类。 ... [详细]

蜡笔小新 2024-11-07 20:19:48
io
267 Collections详解及其应用实例

本文详细介绍了267 Collections的特性和应用场景。作为Java集合框架中的核心接口，Collection接口是所有单列集合类的顶级接口，涵盖了列表、集合和队列等数据结构。通过具体的应用实例，本文深入解析了Collection接口的各种方法和功能，帮助开发者更好地理解和使用这一重要工具。 ... [详细]

蜡笔小新 2024-11-07 20:16:25
io
Java面向对象编程核心概念解析与应用

本文深入解析了Java面向对象编程的核心概念及其应用，重点探讨了面向对象的三大特性：封装、继承和多态。封装确保了数据的安全性和代码的可维护性；继承支持代码的重用和扩展；多态则增强了程序的灵活性和可扩展性。通过具体示例，文章详细阐述了这些特性在实际开发中的应用和优势。 ... [详细]

蜡笔小新 2024-11-07 17:53:00

乐橙味_367

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章