热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【Flink】Flink读取数据的四种方式

Flink读取数据的四种方式准备工作从集合中读取从文件中读取从Kafka中读取自定义读取方式准备工作Flink默认运行时是没有日志的,若想要出现日志,


Flink读取数据的四种方式

  • 准备工作
  • 从集合中读取
  • 从文件中读取
  • 从Kafka中读取
  • 自定义读取方式




准备工作


  • Flink默认运行时是没有日志的,若想要出现日志,需要在pom文件添加

<dependency><groupId>org.slf4jgroupId><artifactId>slf4j-log4j12artifactId><version>1.7.7version>dependency><dependency><groupId>log4jgroupId><artifactId>log4jartifactId><version>1.2.17version>dependency>

  • 在resource目录下创建文件log4j.properties,并且在文件中添加如下内容

log4j.rootLogger=info,console log4j.appender.console=org.apache.log4j.ConsoleAppender
log4j.appender.console.Threshold=INFO
log4j.appender.console.ImmediateFlush=true
log4j.appender.console.Target=System.out
log4j.appender.console.layout=org.apache.log4j.PatternLayout
log4j.appender.console.layout.ConversionPattern=[%-5p] %d(%r) --> [%t] %l: %m %x %n

  • 我们先创建一个自定义JavaBean类

package beans;/*** 传感器温度读数的数据类型*/
public class SenSorReading {private String id;private Long timeStamp;private Double temperature;public SenSorReading() {}public SenSorReading(String id, Long timeStamp, Double temperature) {this.id = id;this.timeStamp = timeStamp;this.temperature = temperature;}public String getId() {return id;}public void setId(String id) {this.id = id;}public Long getTimeStamp() {return timeStamp;}public void setTimeStamp(Long timeStamp) {this.timeStamp = timeStamp;}public Double getTemperature() {return temperature;}public void setTemperature(Double temperature) {this.temperature = temperature;}@Overridepublic String toString() {return "SenSorReading{" +"id=&#39;" + id + &#39;\&#39;&#39; +", timeStamp=" + timeStamp +", temperature=" + temperature +&#39;}&#39;;}
}

跳转顶部




从集合中读取


  • 具体代码

package source;import beans.SenSorReading;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;import java.util.Arrays;public class SourceCollection01 {public static void main(String[] args) throws Exception {//创建执行环境StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();//设置全局的并行度为1,这样子输入和输出的数据结果顺序就会一致env.setParallelism(1);//从集合中读取数据DataStream<SenSorReading> sensorDataStream = env.fromCollection( Arrays.asList(new SenSorReading("sensor_1", 1547718199L, 35.8),new SenSorReading("sensor_6", 1547718201L, 15.4),new SenSorReading("sensor_7", 1547718202L, 6.7),new SenSorReading("sensor_10", 1547718205L, 38.1)));//直接将元素当作集合DataStreamSource<Integer> integerDataStreamSource = env.fromElements(1, 2, 3, 4, 5);//输出sensorDataStream.print("data");integerDataStreamSource.print("int");env.execute("dataFromCollection");}
}

  • 结果展示
    在这里插入图片描述

跳转顶部




从文件中读取


  • 先创建数据文件

sensor_1,1547718199,35.8
sensor_6,1547718201,15.4
sensor_7,1547718202,6.7
sensor_10,1547718205,38.1

  • 具体代码

package source;import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;public class SourceFile01 {public static void main(String[] args) throws Exception {StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();env.setParallelism(1);DataStreamSource<String> stringDataStreamSource = env.readTextFile("src/main/resources/sensor.txt");//打印输出stringDataStreamSource.print();env.execute();}
}

  • 结果展示
    在这里插入图片描述

跳转顶部




从Kafka中读取


  • 先打开Linux虚拟机中的zookeeper、Kafka和Flink

  • 创建一个主题first:bin/kafka-topics.sh --create --zookeeper a:2181 --replication-factor 3 --partitions 1 --topic first

  • 将主题弄成生产者模式:bin/kafka-console-producer.sh --broker-list a:9092 --topic first

  • 具体代码如下

package source;import org.apache.flink.api.common.serialization.SimpleStringSchema;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer011;import java.util.Properties;public class SourceKafka01 {public static void main(String[] args) throws Exception {StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();Properties properties = new Properties();properties.setProperty("bootstrap.servers", "a:9092");properties.setProperty("group.id", "consumer-group");properties.setProperty("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");properties.setProperty("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");properties.setProperty("auto.offset.reset", "latest");DataStreamSource<String> sensor = env.addSource(new FlinkKafkaConsumer011<String>("first", new SimpleStringSchema(), properties));sensor.print();env.execute();}
}

  • 结果展示
    在这里插入图片描述
  • 注意:代码中的a是Linux虚拟机的主机名,一定要修改Windows里面的host文件,修改映射(即使使用IP地址也不行!!!)

跳转顶部




自定义读取方式


  • 创建自定义的SourceFunction

public static class MySensorSource implements SourceFunction<SenSorReading> {//第一一个标识位,用来控制数据的产生private boolean running = true;@Overridepublic void run(SourceContext<SenSorReading> sourceContext) throws Exception {//第一一个随机数发生器Random random = new Random();//设置10个初始温度HashMap<String, Double> sensorTempMap = new HashMap<>();for (int i = 0; i < 10; i++) {sensorTempMap.put("sensor_" + (i + 1), 60 + random.nextGaussian() * 20);}while (running) {for (String sensorId : sensorTempMap.keySet()) {//在前点温度基础上做一个随机波动Double newtemp = sensorTempMap.get(sensorId) + random.nextGaussian();sensorTempMap.put(sensorId, newtemp);sourceContext.collect(new SenSorReading(sensorId, System.currentTimeMillis(), newtemp));}}//控制更新频率Thread.sleep(1000);}@Overridepublic void cancel() {running = false;}}

  • 读取代码

import beans.SenSorReading;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.source.SourceFunction;import java.util.HashMap;
import java.util.Random;public class SourceUDF01 {public static void main(String[] args) throws Exception {StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();DataStreamSource<SenSorReading> dataStreamSource = env.addSource(new MySensorSource());dataStreamSource.print();env.execute();}
}

  • 结果展示
    在这里插入图片描述

跳转顶部




推荐阅读
  • springboot日志【转】【补】
     市面上的日志框架日志门面(日志的抽象层)日志实现JCL(JakartaCommonsLogging)(2014)SLF4j(SimpleLoggingFacadeforJava) ... [详细]
  • java.lang.Class.getDeclaredMethod()方法java.lang.Class.getDeclaredMethod()方法用法实例教程-方法返回一个Met ... [详细]
  • java日志框架详解
    Java日志框架详解1.常用日志框架1.1Java常用日志框架类别1.2Java常用日志框架历史1.3两大日志接口阵营1.3.1基于CommonsLogging接口实现的常用日志框 ... [详细]
  • 基本信息|根源_SpringBoot 监控统计:SQL监控慢SQL记录Spring监控去广告
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了SpringBoot监控统计:SQL监控慢SQL记录Spring监控去广告相关的知识,希望对你有一定的参考价值。 ... [详细]
  • log4j相关
    Log4j的类图Logger-日志写出器,供程序员输出日志信息Appender-日志目的地,把格式化好的日志信息输出到指定的地方去ConsoleAppe ... [详细]
  • springboot项目组引入JMeter的实现步骤
    本文主要介绍了springboot项目组引入JMeter的实现步骤,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的 ... [详细]
  • 利用Dubbo的SPI扩展容器
    在实际开发中,很多Dubbo的服务提供者都会运行在web容器上,如果提供者服务上同时对外 ... [详细]
  • 开发笔记:MyBatis03:ResultMap及分页
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了MyBatis03:ResultMap及分页相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 本文出自:web应用用cronolog分割tomcat的catalina.out文件#wgethttp:cronolog.orgdownloadcronolog-1. ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • 在说Hibernate映射前,我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象,以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • 本文介绍了如何使用Express App提供静态文件,同时提到了一些不需要使用的文件,如package.json和/.ssh/known_hosts,并解释了为什么app.get('*')无法捕获所有请求以及为什么app.use(express.static(__dirname))可能会提供不需要的文件。 ... [详细]
  • Flink使用java实现读取csv文件简单实例首先我们来看官方文档中给出的几种方法:首先我们来看官方文档中给出的几种方法:第一种:Da ... [详细]
  • import?java.io.IOException;import?java.io.InputStream;import?java.util.Properties;impor ... [详细]
author-avatar
OP尋一
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有