当前位置: 开发笔记 > 编程语言 > 正文

SparkStructuredStreaming、Kafak整合

作者：初吻给了烟200309 | 来源：互联网 | 2023-10-10 13:44

StructuredStreamingSBT依赖包：groupIdorg.apache.sparkartifactIdspark-sql-kafka-0-10_2.

Structured Streaming
SBT 依赖包&＃xff1a;

groupId &＃61; org.apache.spark
artifactId &＃61; spark-sql-kafka-0-10_2.11
version &＃61; 2.1.1

在Spark2.x中&＃xff0c;Spark Streaming获得了比较全面的升级&＃xff0c;称为Structured Streaming&＃xff0c;和之前的很不同&＃xff0c;功能更强大&＃xff0c;效率更高&＃xff0c;跟其他的组件整合性也更好。
Spark 2.X提出了continuous application&＃xff08;连续的应用程序&＃xff09;的概念&＃xff0c;非常重大。
首先&＃xff0c;也是最重要的&＃xff0c;在2.x中&＃xff0c;提出了一个叫做continuous applications连续应用程序的概念。
如下图所示&＃xff0c;数据从Kafka中流进来&＃xff0c;通过ETL操作进行数据清洗&＃xff0c;清洗出来作为目标数据进行进一步处理&＃xff0c;可能是机器学习&＃xff0c;也可能是交互式查询&＃xff0c;也有可能直接把数据存在数据库或者其他外部存储设备&＃xff0c;也有可能是直接交给已有的应用程序。也就是说SparkStreaming从获得数据后&＃xff0c;能把全部处理环节串联起来&＃xff0c;称之为端到端(End to end)处理!!!

#
http://spark.apache.org/docs/latest/streaming-kafka-0-10-integration.html

groupId &＃61; org.apache.spark
artifactId &＃61; spark-sql-kafka-0-10_2.11
version &＃61; 2.1.1

http://blog.csdn.net/javastart/article/details/50942397
未完成待续
參考文献&＃xff1a;
【1】http://spark.apache.org/docs/latest/structured-streaming-kafka-integration.html 官网简单介绍
【2】http://www.cnblogs.com/dt-zhw/p/5597353.html Spark定制班第29课&＃xff1a;深入理解Spark 2.x中的Structured Streaming内幕
【3】https://www.iteblog.com/archives/1322.html 实际较详细的例子
【4】https://github.com/ansrivas/spark-structured-streaming/blob/master/src/main/scala/com/kafkaToSparkToCass/Main.scala
代码参考

推荐阅读

int
深入解析Socket结构与实现

本文详细介绍了Socket在Linux内核中的实现机制，包括基本的Socket结构、协议操作集以及不同协议下的具体实现。通过这些内容，读者可以更好地理解Socket的工作原理。 ... [详细]

蜡笔小新 2024-11-24 12:00:27
int
Linux线程中私有数据的管理与保护

本文探讨了Linux环境下线程私有数据(Thread-Specific Data, TSD)的概念及其重要性，介绍了如何通过TSD技术避免多线程间全局变量冲突的问题，并提供了具体的实现方法和示例代码。 ... [详细]

蜡笔小新 2024-11-23 13:45:37
int
hlg_oj_1116_选美大赛

hlg_oj_1116_选美大赛这题是最长子序列，然后再求出路径就可以了。开始写的比较乱，用数组什么的，后来用了指针就好办了。现在把代码贴 ... [详细]

蜡笔小新 2024-11-22 09:20:30
web
ABAP开发者需关注的几大关键问题

长期从事ABAP开发工作的专业人士，在面对行业新趋势时，往往需要重新审视自己的发展方向。本文探讨了几位资深专家对ABAP未来走向的看法，以及开发者应如何调整技能以适应新的技术环境。 ... [详细]

蜡笔小新 2024-11-21 18:21:06
int
树剖||树链剖分||线段树||BZOJ4034||Luogu3178||[HAOI2015]树上操作

题面：P3178[HAOI2015]树上操作好像其他人都嫌这道题太容易了懒得讲，好吧那我讲。题解：第一个操作和第二个操作本质上是一样的&# ... [详细]

蜡笔小新 2024-11-24 15:06:53
int
Android 开发技巧：动态修改 strings.xml 文件中的字符串值

本文介绍了一种在 Android 开发中动态修改 strings.xml 文件中字符串值的有效方法。通过使用占位符，开发者可以在运行时根据需要填充具体的值，从而提高应用的灵活性和可维护性。 ... [详细]

蜡笔小新 2024-11-24 11:51:17
php
PHP Memcached 使用详解

本文详细介绍了如何在PHP中使用Memcached进行数据缓存，包括服务器连接、数据操作、高级功能等。 ... [详细]

蜡笔小新 2024-11-24 09:51:34
ascii
【MySQL】frm文件解析

官网说明：http:dev.mysql.comdocinternalsenfrm-file-format.htmlfrm是MySQL表结构定义文件，通常frm文件是不会损坏的，但是如果 ... [详细]

蜡笔小新 2024-11-23 10:29:06
int
Node.js OS 模块中的 arch 方法解析

本文详细介绍了 Node.js 中 OS 模块的 arch 方法，包括其功能、语法、参数以及返回值，并提供了具体的使用示例。 ... [详细]

蜡笔小新 2024-11-23 10:19:37
object
CentOS 中 SWAP 分区的创建与管理

本文详细介绍了在 CentOS 系统中如何创建和管理 SWAP 分区，包括临时创建交换文件、永久性增加交换空间的方法，以及如何手动释放内存缓存。 ... [详细]

蜡笔小新 2024-11-21 19:01:54
int
如何将过往经历转化为职场动力

本文探讨了如何将个人经历，特别是非传统的职业路径，转化为职业生涯中的优势。通过作者的亲身经历，展示了舞蹈生涯对商业思维的影响。 ... [详细]

蜡笔小新 2024-11-21 17:49:51
int
洛谷 P4009 汽车加油行驶问题解析

探讨了经典算法题目——汽车加油行驶问题，通过网络流和费用流的视角，深入解析了该问题的解决方案。本文将详细阐述如何利用最短路径算法解决这一问题，并提供详细的代码实现。 ... [详细]

蜡笔小新 2024-11-21 14:21:38
window
流处理中的计数挑战与解决方案

本文探讨了在流处理中进行计数的各种技术和挑战，并基于作者在2016年圣何塞举行的Hadoop World大会上的演讲进行了深入分析。文章不仅介绍了传统批处理和Lambda架构的局限性，还详细探讨了流处理架构的优势及其在现代大数据应用中的重要作用。 ... [详细]

蜡笔小新 2024-11-20 13:50:01
web
解决PHP及Web开发中的UTF-8乱码问题

本文详细探讨了在Web开发中常见的UTF-8编码问题及其解决方案，包括HTML页面、PHP脚本、MySQL数据库以及JavaScript和Flash应用中的乱码问题。 ... [详细]

蜡笔小新 2024-11-20 10:58:03
int
Maven快照版本管理及更新策略详解

本文深入探讨了Maven中的快照版本管理和更新策略，解释了快照版本与正式版本的区别，并提供了如何配置快照更新策略的方法，以确保项目依赖始终保持最新。 ... [详细]

蜡笔小新 2024-11-24 06:20:08

初吻给了烟200309

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章