跳至主要內容
Spark原理与实践

Spark介绍

大数据处理技术栈

开源大数据处理引擎

Spark 生态&特点

  • 统一引擎,支持多种分布式场景
  • 多语言支持
  • 可读写丰富数据源
  • 丰富灵活的APIV算子
  • 支持K8S/YARN/Mesos资源调度

fatSheep大约 1 分钟BigData字节青训营Spark计算框架
Flink

Flink简介

基本概念

Apache Flink是一个开源的流处理框架,应用于分布式、高性能、高可用的数据流应用程序。可以处理有限数据流和无限数据,即能够处理有边界和无边界的数据流。无边界的数据流就是真正意义上的流数据,所以Flink是支持流计算的。有边界的数据流就是批数据,所以也支持批处理的。不过Flink在流处理上的应用比在批处理上的应用更加广泛,统一批处理和流处理也是Flink目标之一。Flink可以部署在各种集群环境,可以对各种大小规模的数据进行快速计算。


fatSheep大约 10 分钟BigDataJava计算框架Flink字节青训营