Checkpoint 在 Flink 中是一个非常重要的 Feature，Checkpoint 使 Flink 的状态具有良好的容错性，通过 Checkpoint 机制，Flink 可以对作业的状态和计算位置进行恢复。本节主要讲述在 Flink 中 Checkpoint 和 Savepoint 的使用方式及它们之间的区别。

more >>

2021-07-25

《Flink 实战与性能优化》—— Flink 状态后端存储

4.2 Flink 状态后端存储

在 4.1 节中介绍了 Flink 中的状态，那么在生产环境中，随着作业的运行时间变长，状态会变得越来越大，那么如何将这些状态存储也是 Flink 要解决的一大难点，本节来讲解下 Flink 中不同类型的状态后端存储。

more >>

2021-07-24

《Flink 实战与性能优化》—— 深度讲解 Flink 中的状态

第四章 —— Flink 中的状态及容错机制

Flink 对比其他的流处理框架最大的特点是其支持状态，本章将深度的讲解 Flink 中的状态分类，如何在不同的场景使用不同的状态，接着会介绍 Flink 中的多种状态存储，最后会介绍 Checkpoint 和 Savepoint 的使用方式以及如何恢复状态。

4.1 深度讲解 Flink 中的状态

more >>

2021-07-23

《Flink 实战与性能优化》—— 使用 Side Output 分流

3.12 使用 Side Output 分流

通常，在 Kafka 的 topic 中会有很多数据，这些数据虽然结构是一致的，但是类型可能不一致，举个例子：Kafka 中的监控数据有很多种：机器、容器、应用、中间件等，如果要对这些数据分别处理，就需要对这些数据流进行一个拆分，那么在 Flink 中该怎么完成这需求呢，有如下这些方法。

more >>

2021-07-22

《Flink 实战与性能优化》—— Flink Connector —— Redis 的用法

3.11 Flink Connector —— Redis 的用法

在生产环境中，通常会将一些计算后的数据存储在 Redis 中，以供第三方的应用去 Redis 查找对应的数据，至于 Redis 的特性笔者不会在本节做过多的讲解。

more >>

2021-07-21

《Flink 实战与性能优化》—— Flink Connector —— HBase 的用法

3.10 Flink Connector —— HBase 的用法

HBase 是一个分布式的、面向列的开源数据库，同样，很多公司也有使用该技术存储数据的，本节将对 HBase 做些简单的介绍，以及利用 Flink HBase Connector 读取 HBase 中的数据和写入数据到 HBase 中。

more >>

2021-07-20

《Flink 实战与性能优化》—— Flink Connector —— ElasticSearch 的用法和分析

3.9 Flink Connector —— ElasticSearch 的用法和分析

ElasticSearch 现在也是非常火的一门技术，目前很多公司都有使用，本节将介绍 Flink ElasticSearch Connector 的实战使用和可能会遇到的问题。

more >>

2021-07-19

《Flink 实战与性能优化》—— 自定义 Flink Connector

3.8 自定义 Flink Connector

在前面文章 3.6 节中讲解了 Flink 中的 Data Source 和 Data Sink，然后介绍了 Flink 中自带的一些 Source 和 Sink 的 Connector，接着我们还有几篇实战会讲解了如何从 Kafka 处理数据写入到 Kafka、ElasticSearch 等，当然 Flink 还有一些其他的 Connector，我们这里就不一一介绍了，大家如果感兴趣的话可以去官网查看一下，如果对其代码实现比较感兴趣的话，也可以去看看其源码的实现。我们这篇文章来讲解一下如何自定义 Source 和 Sink Connector？这样我们后面再遇到什么样的需求都难不倒我们了。

more >>

2021-07-17

《Flink 实战与性能优化》—— Flink Connector —— Kafka 的使用和源码分析

3.7 Flink Connector —— Kafka 的使用和源码分析

在前面 3.6 节中介绍了 Flink 中的 Data Source 和 Data Sink，然后还讲诉了自带的一些 Source 和 Sink 的 Connector。本篇文章将讲解一下用的最多的 Connector —— Kafka，带大家利用 Kafka Connector 读取 Kafka 数据，做一些计算操作后然后又通过 Kafka Connector 写入到 kafka 消息队列去，整个案例的执行流程如下图所示。

more >>

2021-07-16

《Flink 实战与性能优化》—— Flink 常用的 Source Connector 和 Sink Connector 介绍

3.6 Flink 常用的 Source Connector 和 Sink Connector 介绍

通过前面我们可以知道 Flink Job 的大致结构就是 Source ——> Transformation ——> Sink。

more >>

2021-07-15

《Flink 实战与性能优化》—— Watermark 的用法和结合 Window 处理延迟数据

3.5 Watermark 的用法和结合 Window 处理延迟数据

在 3.1 节中讲解了 Flink 中的三种 Time 和其对应的使用场景，然后在 3.2 节中深入的讲解了 Flink 中窗口的机制以及 Flink 中自带的 Window 的实现原理和使用方法。如果在进行 Window 计算操作的时候，如果使用的时间是 Processing Time，那么在 Flink 消费数据的时候，它完全不需要关心的数据本身的时间，意思也就是说不需要关心数据到底是延迟数据还是乱序数据。因为 Processing Time 只是代表数据在 Flink 被处理时的时间，这个时间是顺序的。但是如果你使用的是 Event Time 的话，那么你就不得不面临着这么个问题：事件乱序 & 事件延迟。

more >>

2021-07-14

《Flink 实战与性能优化》—— 使用 DataStream API 来处理数据

3.4 使用 DataStream API 来处理数据

在 3.3 节中讲了数据转换常用的 Operators（算子），然后在 3.2 节中也讲了 Flink 中窗口的概念和原理，那么我们这篇文章再来细讲一下 Flink 中的各种 DataStream API。

more >>

2021-07-13

《Flink 实战与性能优化》—— Flink 数据转换必须熟悉的算子（Operator)

3.3 必须熟悉的数据转换 Operator(算子)

在 Flink 应用程序中，无论你的应用程序是批程序，还是流程序，都是上图这种模型，有数据源（source），有数据下游（sink），我们写的应用程序多是对数据源过来的数据做一系列操作，总结如下。

more >>

2021-07-12

《Flink 实战与性能优化》—— 如何使用 Flink Window 及 Window 基本概念与实现原理?

3.2 Flink Window 基础概念与实现原理

目前有许多数据分析的场景从批处理到流处理的演变，虽然可以将批处理作为流处理的特殊情况来处理，但是分析无穷集的流数据通常需要思维方式的转变并且具有其自己的术语，例如，“windowing（窗口化）”、“at-least-once（至少一次）”、“exactly-once（只有一次）” 。

more >>

2021-07-11

《Flink 实战与性能优化》—— Flink 中 Processing Time、Event Time、Ingestion Time 对比及其使用场景分析

第三章 —— Flink 中的流计算处理

通过第二章的入门案例讲解，相信你已经知道了 Flink 程序的开发过程，本章将带你熟悉 Flink 中的各种特性，比如多种时间语义、丰富的窗口机制、流计算中常见的运算操作符、Watermark 机制、丰富的 Connectors（Kafka、ElasticSearch、Redis、HBase 等）的使用方式。除了介绍这些知识点的原理之外，笔者还将通过案例来教会大家如何去实战使用，最后还会讲解这些原理的源码实现，希望你可以更深刻的理解这些特性。

3.1 Flink 多种时间语义对比

more >>

2021-07-10

《Flink 实战与性能优化》—— 案例2：实时处理 Socket 数据

2.4 案例2：实时处理 Socket 数据

在 2.3 节中讲解了 Flink 最简单的 WordCount 程序的创建、运行结果查看和代码分析，本节将继续带大家来看一个入门上手的程序：Flink 处理 Socket 数据。

more >>

2021-07-09

《Flink 实战与性能优化》—— 案例1：WordCount 应用程序

2.3 案例1：WordCount 应用程序

在 2.2 节中带大家讲解了下 Flink 的环境安装，这篇文章就开始我们的第一个 Flink 案例实战，也方便大家快速开始自己的第一个 Flink 应用。大数据里学习一门技术一般都是从 WordCount 开始入门的，那么笔者还是不打破常规了，所以这篇文章笔者也将带大家通过 WordCount 程序来初步了解 Flink。

more >>