热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

4.1.18Flink流处理框架WindowAPI之窗口函数windowfunction

目录1.windowfunction-窗口函数2.其他可选API3.代码演示3.1TimeWindow3.2CountWindow1.windowfunction-窗口函

目录

1.window function-窗口函数

2.其他可选API

3.代码演示

3.1 TimeWindow

3.2 CountWindow



1.window function-窗口函数

        window function 定义了要对窗口中收集的数据做的计算操作,主要可以分为两类:

  • 增量聚合函数(incremental aggregation functions) 每条数据到来就进行计算,保持一个简单的状态。典型的增量聚合函数有 ReduceFunction, AggregateFunction。(来一个处理一个)
  • 全窗口函数(full window functions) 先把窗口所有数据收集起来,等到计算的时候会遍历所有数据。 ProcessWindowFunction和WindowFunction就是全窗口函数。(一个窗口一起处理)

        

2.其他可选API
  •  .trigger() —— 触发器      定义 window 什么时候关闭,触发计算并输出结果
  •  .evitor() —— 移除器       定义移除某些数据的逻辑
  •  .allowedLateness() —— 允许处理迟到的数据
  •  .sideOutputLateData() —— 将迟到的数据放入侧输出流
  •  .getSideOutput() —— 获取侧输出流

3.代码演示

3.1 TimeWindow时间窗口

package com.atguigu.apitest.window;import com.atguigu.apitest.beans.SensorReading;
import org.apache.commons.collections.IteratorUtils;
import org.apache.flink.api.common.functions.AggregateFunction;
import org.apache.flink.api.common.functions.ReduceFunction;
import org.apache.flink.api.java.tuple.Tuple;
import org.apache.flink.api.java.tuple.Tuple3;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.windowing.ProcessWindowFunction;
import org.apache.flink.streaming.api.functions.windowing.WindowFunction;
import org.apache.flink.streaming.api.windowing.assigners.EventTimeSessionWindows;
import org.apache.flink.streaming.api.windowing.assigners.TumblingEventTimeWindows;
import org.apache.flink.streaming.api.windowing.assigners.TumblingProcessingTimeWindows;
import org.apache.flink.streaming.api.windowing.time.Time;
import org.apache.flink.streaming.api.windowing.windows.TimeWindow;
import org.apache.flink.util.Collector;
import org.apache.flink.util.OutputTag;import java.util.Arrays;
import java.util.Collections;public class WindowTest1_TimeWindow {public static void main(String[] args) throws Exception {StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();env.setParallelism(1);// // 从文件读取数据
// DataStream inputStream = env.readTextFile("D:\\Projects\\BigData\\FlinkTutorial\\src\\main\\resources\\sensor.txt");// socket文本流DataStream inputStream = env.socketTextStream("localhost", 7777);// 转换成SensorReading类型DataStream dataStream = inputStream.map(line -> {String[] fields = line.split(",");return new SensorReading(fields[0], new Long(fields[1]), new Double(fields[2]));});// 开窗测试// 1. 增量聚合函数DataStream resultStream = dataStream.keyBy("id")
// .countWindow(10, 2);
// .window(EventTimeSessionWindows.withGap(Time.minutes(1)));
// .window(TumblingProcessingTimeWindows.of(Time.seconds(15))).timeWindow(Time.seconds(15))//聚合统计总数.aggregate(new AggregateFunction() {@Overridepublic Integer createAccumulator() {return 0;}@Overridepublic Integer add(SensorReading value, Integer accumulator) {return accumulator + 1;}@Overridepublic Integer getResult(Integer accumulator) {return accumulator;}@Overridepublic Integer merge(Integer a, Integer b) {return a + b;}});// 2. 全窗口函数SingleOutputStreamOperator> resultStream2 = dataStream.keyBy("id").timeWindow(Time.seconds(15))
// .process(new ProcessWindowFunction() {
// }).apply(new WindowFunction, Tuple, TimeWindow>() {&#64;Overridepublic void apply(Tuple tuple, TimeWindow window, Iterable input, Collector> out) throws Exception {String id &#61; tuple.getField(0);Long windowEnd &#61; window.getEnd();Integer count &#61; IteratorUtils.toList(input.iterator()).size();out.collect(new Tuple3<>(id, windowEnd, count));}});// 3. 其它可选APIOutputTag outputTag &#61; new OutputTag("late") {};SingleOutputStreamOperator sumStream &#61; dataStream.keyBy("id").timeWindow(Time.seconds(15))
// .trigger()
// .evictor().allowedLateness(Time.minutes(1)).sideOutputLateData(outputTag).sum("temperature");sumStream.getSideOutput(outputTag).print("late");resultStream2.print();env.execute();}
}

3.2 CountWindow计数窗口

package com.atguigu.apitest.window;
import com.atguigu.apitest.beans.SensorReading;
import org.apache.flink.api.common.functions.AggregateFunction;
import org.apache.flink.api.common.functions.ReduceFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;public class WindowTest2_CountWindow {public static void main(String[] args) throws Exception {StreamExecutionEnvironment env &#61; StreamExecutionEnvironment.getExecutionEnvironment();env.setParallelism(1);// // 从文件读取数据
// DataStream inputStream &#61; env.readTextFile("D:\\Projects\\BigData\\FlinkTutorial\\src\\main\\resources\\sensor.txt");// socket文本流DataStream inputStream &#61; env.socketTextStream("localhost", 7777);// 转换成SensorReading类型DataStream dataStream &#61; inputStream.map(line -> {String[] fields &#61; line.split(",");return new SensorReading(fields[0], new Long(fields[1]), new Double(fields[2]));});// 开计数窗口测试SingleOutputStreamOperator avgTempResultStream &#61; dataStream.keyBy("id").countWindow(10, 2).aggregate(new MyAvgTemp());avgTempResultStream.print();env.execute();}public static class MyAvgTemp implements AggregateFunction, Double>{&#64;Overridepublic Tuple2 createAccumulator() {return new Tuple2<>(0.0, 0);}&#64;Overridepublic Tuple2 add(SensorReading value, Tuple2 accumulator) {return new Tuple2<>(accumulator.f0 &#43; value.getTemperature(), accumulator.f1 &#43; 1);}&#64;Overridepublic Double getResult(Tuple2 accumulator) {return accumulator.f0 / accumulator.f1;}&#64;Overridepublic Tuple2 merge(Tuple2 a, Tuple2 b) {return new Tuple2<>(a.f0 &#43; b.f0, a.f1 &#43; b.f1);}}
}


推荐阅读
  • C++字符字符串处理及字符集编码方案
    本文介绍了C++中字符字符串处理的问题,并详细解释了字符集编码方案,包括UNICODE、Windows apps采用的UTF-16编码、ASCII、SBCS和DBCS编码方案。同时说明了ANSI C标准和Windows中的字符/字符串数据类型实现。文章还提到了在编译时需要定义UNICODE宏以支持unicode编码,否则将使用windows code page编译。最后,给出了相关的头文件和数据类型定义。 ... [详细]
  • vue使用
    关键词: ... [详细]
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • 展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]
  • 基于dlib的人脸68特征点提取(眨眼张嘴检测)python版本
    文章目录引言开发环境和库流程设计张嘴和闭眼的检测引言(1)利用Dlib官方训练好的模型“shape_predictor_68_face_landmarks.dat”进行68个点标定 ... [详细]
  • 本文介绍了闭包的定义和运转机制,重点解释了闭包如何能够接触外部函数的作用域中的变量。通过词法作用域的查找规则,闭包可以访问外部函数的作用域。同时还提到了闭包的作用和影响。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 本文介绍了pack布局管理器在Perl/Tk中的使用方法及注意事项。通过调用pack()方法,可以控制部件在显示窗口中的位置和大小。同时,本文还提到了在使用pack布局管理器时,应注意将部件分组以便在水平和垂直方向上进行堆放。此外,还介绍了使用Frame部件或Toplevel部件来组织部件在窗口内的方法。最后,本文强调了在使用pack布局管理器时,应避免在中间切换到grid布局管理器,以免造成混乱。 ... [详细]
  • 本文详细介绍了Android中的坐标系以及与View相关的方法。首先介绍了Android坐标系和视图坐标系的概念,并通过图示进行了解释。接着提到了View的大小可以超过手机屏幕,并且只有在手机屏幕内才能看到。最后,作者表示将在后续文章中继续探讨与View相关的内容。 ... [详细]
  • javascript  – 概述在Firefox上无法正常工作
    我试图提出一些自定义大纲,以达到一些Web可访问性建议.但我不能用Firefox制作.这就是它在Chrome上的外观:而那个图标实际上是一个锚点.在Firefox上,它只概述了整个 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • 本文介绍了UVALive6575题目Odd and Even Zeroes的解法,使用了数位dp和找规律的方法。阶乘的定义和性质被介绍,并给出了一些例子。其中,部分阶乘的尾零个数为奇数,部分为偶数。 ... [详细]
  • 本文介绍了PE文件结构中的导出表的解析方法,包括获取区段头表、遍历查找所在的区段等步骤。通过该方法可以准确地解析PE文件中的导出表信息。 ... [详细]
  • 利用Visual Basic开发SAP接口程序初探的方法与原理
    本文介绍了利用Visual Basic开发SAP接口程序的方法与原理,以及SAP R/3系统的特点和二次开发平台ABAP的使用。通过程序接口自动读取SAP R/3的数据表或视图,在外部进行处理和利用水晶报表等工具生成符合中国人习惯的报表样式。具体介绍了RFC调用的原理和模型,并强调本文主要不讨论SAP R/3函数的开发,而是针对使用SAP的公司的非ABAP开发人员提供了初步的接口程序开发指导。 ... [详细]
  • 本文介绍了解决mysql 5.1启动问题的方法,通过修改my.ini文件中的相关配置,包括innodb_data_home_dir和skip-innodb等,可以解决启动问题。同时还介绍了如何调整内存池来存储metadata信息。 ... [详细]
author-avatar
羚之舞
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有