跳至主要內容
Exactly Once 语义在 Flink 中的实现

数据流和动态表

传统SQL和流处理

特征 SQL 流处理
处理数据的有界性 处理的表是有界的 流是一个无限元祖序列
处理数据的完整性 执行查询可以访问完整的数据 执行查询无法访问所有的数据
执行时间 批处理查询产生固定大小结果后终止 查询不断更新结果,永不终止

fatSheep大约 4 分钟BigDataFlink字节青训营
Flink

Flink简介

基本概念

Apache Flink是一个开源的流处理框架,应用于分布式、高性能、高可用的数据流应用程序。可以处理有限数据流和无限数据,即能够处理有边界和无边界的数据流。无边界的数据流就是真正意义上的流数据,所以Flink是支持流计算的。有边界的数据流就是批数据,所以也支持批处理的。不过Flink在流处理上的应用比在批处理上的应用更加广泛,统一批处理和流处理也是Flink目标之一。Flink可以部署在各种集群环境,可以对各种大小规模的数据进行快速计算。


fatSheep大约 10 分钟BigDataJava计算框架Flink字节青训营