Flink两阶段提交sink探索（Mysql）

作者：SCY瑶_450 | 来源：互联网 | 2023-09-18 18:01

1.简单介绍目的Flink能够提供其应用内部范围的端到端的exeatly-onece语义数据流转，其本身提供的KafkaSink连接器便继承了TwoPhaseCom

1. 简单介绍目的

Flink能够提供其应用内部范围的端到端的exeatly-onece语义数据流转&＃xff0c;其本身提供的Kafka Sink连接器便继承了TwoPhaseCommitSinkFunction抽象类&＃xff0c;使用两阶段提交方式&＃xff08;需事务操作支持&＃xff09;结合Flink的checkpoint保证端到端一致性。而Mysql数据库支持事务&＃xff0c;那我们为了实现数据写入Mysql时也保证程序的端到端一致性&＃xff0c;是否可以继承该抽象类&＃xff1f;

2. 主程序

import org.apache.flink.shaded.jackson2.com.fasterxml.jackson.databind.node.ObjectNode; import org.apache.flink.streaming.api.CheckpointingMode; import org.apache.flink.streaming.api.datastream.DataStreamSource; import org.apache.flink.streaming.api.environment.CheckpointConfig; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer011; import org.apache.flink.streaming.util.serialization.JSONKeyValueDeserializationSchema; import org.apache.kafka.clients.consumer.ConsumerConfig; import java.util.Properties;public class StreamDemoKafka2Mysql {public static void main(String[] args) throws Exception {StreamExecutionEnvironment env &＃61; StreamExecutionEnvironment.getExecutionEnvironment();// 设置并行度&＃xff0c;为了方便测试&＃xff0c;查看消息的顺序&＃xff0c;这里设置为1&＃xff0c;可以更改为多并行度env.setParallelism(1);// checkpoint设置// 每隔1s进行启动一个检查点【设置checkpoint的周期】env.enableCheckpointing(1000);// 设置模式为&＃xff1a;exactly_one&＃xff0c;仅一次语义env.getCheckpointConfig().setCheckpointingMode(CheckpointingMode.EXACTLY_ONCE);// 确保检查点之间有1s的时间间隔【checkpoint最小间隔】env.getCheckpointConfig().setMinPauseBetweenCheckpoints(1000);// 检查点必须在1s之内完成&＃xff0c;或者被丢弃【checkpoint超时时间】env.getCheckpointConfig().setCheckpointTimeout(1000);// 同一时间只允许进行一次检查点env.getCheckpointConfig().setMaxConcurrentCheckpoints(1);//表示一旦Flink程序被cancel后&＃xff0c;会保留checkpoint数据&＃xff0c;以便根据实际需要恢复到指定的checkpointenv.getCheckpointConfig().enableExternalizedCheckpoints(CheckpointConfig.ExternalizedCheckpointCleanup.RETAIN_ON_CANCELLATION);//设置statebackend,将检查点保存在hdfs上面&＃xff0c;默认保存在内存中。这里先保存到本地// env.setStateBackend(new FsStateBackend("file:///F:/kafkaTool/aaa"));// 设置kafka消费参数Properties props &＃61; new Properties();props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "192.168.191.128:9091,192.168.191.128:9092,192.168.191.128:9093");props.put(ConsumerConfig.GROUP_ID_CONFIG, "flink-consumer-group1");props.put(ConsumerConfig.ENABLE_AUTO_COMMIT_CONFIG, "false");props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");/*SimpleStringSchema可以获取到kafka消息&＃xff0c;JSONKeyValueDeserializationSchema可以获取都消息的key,value&＃xff0c;metadata:topic,partition&＃xff0c;offset等信息*///FlinkKafkaConsumer011 kafkaConsumer011 &＃61; new FlinkKafkaConsumer011<>(topic, new SimpleStringSchema(), props);FlinkKafkaConsumer011<ObjectNode> kafkaConsumer011 &＃61; new FlinkKafkaConsumer011<>("flink-consumer-group1", new JSONKeyValueDeserializationSchema(true), props); // kafkaConsumer011.setStartFromLatest(); // 由于设置该选项导致一直从最新offset开始消费kafkaConsumer011.setCommitOffsetsOnCheckpoints(true);kafkaConsumer011.setStartFromGroupOffsets();System.out.println("kafkaConsumer011:" &＃43; kafkaConsumer011);//加入kafka数据源DataStreamSource<ObjectNode> streamSource &＃61; env.addSource(kafkaConsumer011).setParallelism(1);streamSource.print().setParallelism(1);streamSource.print("------------>:");//数据传输到下游streamSource.addSink(new MySqlTwoPhaseNewCommitSink2()).name("MySqlTwoPhaseCommitSink2").setParallelism(1);//触发执行env.execute(StreamDemoKafka2Mysql.class.getName());} }

3. 自定义Sink

4. 使用的工具类

import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException;public class DBConnectUtil {public static Connection getConnection(String url, String user, String password) throws SQLException {Connection conn &＃61; null;try {Class.forName("com.mysql.jdbc.Driver");} catch (ClassNotFoundException e) {e.printStackTrace();}conn &＃61; DriverManager.getConnection(url, user, password);//设置手动提交conn.setAutoCommit(false);return conn;}public static void commit(Connection conn) {if (conn !&＃61; null) {try {conn.commit();} catch (SQLException e) {e.printStackTrace();} finally {close(conn);}}}public static void rollback(Connection conn) {if (conn !&＃61; null) {try {conn.rollback();} catch (SQLException e) {e.printStackTrace();} finally {close(conn);}}}public static void close(Connection conn) {if (conn !&＃61; null) {try {conn.close();} catch (Exception e) {e.printStackTrace();}}} }

5. 结果

开始消费后&＃xff0c;一直执行invoke直到所有数据消费完&＃xff0c;然后是
start preCommit…和start beginTransaction…循环执行&＃xff0c;在网上找了很多例子&＃xff0c;大致都是这样写的&＃xff0c;但是始终不能成功。

6. 参考文章&＃xff1a;

参考文章1
参考文章2
参考文章3(可看其参考文章)
参考文章4

推荐阅读

input
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
js
vue使用

关键词： ... [详细]

蜡笔小新 2023-12-14 19:14:56
int
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
int
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
python
使用 Ubuntu 中的 Python 获取浏览器历史记录

使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]

蜡笔小新 2023-12-14 08:57:59
python
python创建一个窗口_等一个大佬啊要求用python创建一个窗口，窗口按钮功能是创建一个球体或立方体。明天上课之前交给我...

展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]

蜡笔小新 2023-12-13 16:26:09
python
Python实现变声器功能(萝莉音御姐音)的方法及步骤

本文介绍了使用Python实现变声器功能(萝莉音御姐音)的方法及步骤。首先登录百度AL开发平台，选择语音合成，创建应用并填写应用信息，获取Appid、API Key和Secret Key。然后安装pythonsdk，可以通过pip install baidu-aip或python setup.py install进行安装。最后，书写代码实现变声器功能，使用AipSpeech库进行语音合成，可以设置音量等参数。 ... [详细]

蜡笔小新 2023-12-14 16:21:36
python
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
int
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
int
javascript – 概述在Firefox上无法正常工作

我试图提出一些自定义大纲,以达到一些Web可访问性建议.但我不能用Firefox制作.这就是它在Chrome上的外观：而那个图标实际上是一个锚点.在Firefox上,它只概述了整个 ... [详细]

蜡笔小新 2023-12-14 10:20:38
int
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
tags
scrapy存入excel时，excel文件被反复擦除重写。文件大小始终不超过100k，请问这种情况改如何解决

怀疑是每次都在新建文件，具体代码如下 ... [详细]

蜡笔小新 2023-12-13 17:53:49
int
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
int
XML介绍与使用的概述及标签规则

本文介绍了XML的基本概念和用途，包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则，包括标签的尖括号和合法标识符的组成，标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读，读者可以对XML的基本知识有一个全面的了解。 ... [详细]

蜡笔小新 2023-12-13 17:39:50
input
java 模拟get post请求_Java后台模拟发送http的get和post请求，并测试

个人学习使用：谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]

蜡笔小新 2023-12-13 14:20:23

SCY瑶_450

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章