Apache Flink®

数据流上的有状态计算

Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。

Flink Capabilities
正确性保证

Exactly-once 状态一致性

事件时间处理

成熟的迟到数据处理

分层 API

SQL on Stream & Batch Data

DataStream API

ProcessFunction (Time & State)

聚焦运维

灵活部署

高可用

保存点

大规模计算

水平扩展架构

支持超大状态

增量检查点机制

性能卓越

低延迟

高吞吐

内存计算

所有流式场景
事件驱动应用

事件驱动型应用是一类具有状态的应用,它从一个或多个事件流提取数据,并根据到来的事件触发计算、状态更新或其他外部动作。

流批分析

Analytical jobs extract information and insight from raw data. Apache Flink supports traditional batch queries on bounded data sets and real-time, continuous queries from unbounded, live data streams.

数据管道 & ETL

提取-转换-加载(ETL)是一种在存储系统之间进行数据转换和迁移的常用方法。

最新博客列表
Apache Flink Kubernetes Operator 1.12.0 Release Announcement

2025年6月3日 - Gabor Somogyi.

The Apache Flink community is excited to announce the release of Flink Kubernetes Operator 1.12.0! The version brings a number of important fixes and improvements to both core and autoscaler modules. …

Continue reading
Apache Flink CDC 3.4.0 Release Announcement

2025年5月16日 - Yanquan Lv.

The Apache Flink Community is excited to announce the release of Flink CDC 3.4.0! This release introduces a new pipeline Connector for Apache Iceberg, and provides support for batch execution mode, …

Continue reading
Introducing the Externalized Kudu Connector

2025年4月30日 - Ferenc Csaky.

We are pleased to announce the revival of a connector that makes it possible for Flink to interact with Apache Kudu. The original connector existed as part of the Apache Bahir project, which was moved …

Continue reading