Flink
Apache Flink是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink被设计在所有常见的集群环境中运行,以内存执行速度和任意规模来执行计算。
Flink项目的理念是:“Apache Flink是为分布式、高性能、随时可用以及准确的流处理应用程序打造的开源流处理框架”。
目标:
低延迟,高吞吐,准确性
传统数据处理架构
事务处理
分析处理
sparkstreaming也需要时间攒齐
有状态的流式处理
来一条处理一条
如何保证乱序情况下 结果的正确性
第一代流式处理架构
sparkstreaming不能处理乱序也没有时间语义;
Flink的主要特点