Java版Flink使用指南——定制RabbitMQ数据源的序列化器

🕗 发布于 2024-07-09 05:45 java-rabbitmq java flink

大纲

新建工程
测试
- 修改Slot个数
- 打包、提交、运行
工程代码

在《Java版Flink使用指南——从RabbitMQ中队列中接入消息流》一文中，我们从RabbitMQ队列中读取了字符串型数据。如果我们希望读取的数据被自动化转换为一个对象，则需要定制序列化器。本文我们就将讲解数据源序列化器的定制方法。

新建工程

我们在IntelliJ中新建一个工程SourceSerializer。
Archetype填入：org.apache.flink:flink-quickstart-java
版本填入与Flink的版本：1.19.1
在这里插入图片描述

新增依赖

在pom.xml中新增RabbitMQ连接器

<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-connector-rabbitmq</artifactId>
<version>3.0.1-1.17</version>
</dependency>

新增Json库依赖

<dependency>
<groupId>com.fasterxml.jackson.core</groupId>
<artifactId>jackson-core</artifactId>
<version>2.17.1</version>
</dependency>

新增lombok库，主要是为了使用它的一些注解

        <dependency>
            <groupId>org.projectlombok</groupId>
            <artifactId>lombok</artifactId>
            <version>1.18.32</version>
            <scope>provided</scope>
        </dependency>

数据对象

我们新建一个简单的数据对象SampleData
src/main/java/org/example/vo/SampleData.java

package org.example.vo;

import org.apache.flink.shaded.jackson2.com.fasterxml.jackson.databind.ObjectMapper;

import org.apache.flink.shaded.jackson2.com.fasterxml.jackson.core.JsonProcessingException;

import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;

@Data
@NoArgsConstructor
@AllArgsConstructor
public class SampleData {
    private Long id;
    private String name;
    private int age;
    private Boolean married;
    private Double salary;

    public String toJson() throws JsonProcessingException {
        ObjectMapper mapper = new ObjectMapper();
        return mapper.writeValueAsString(this);
    }

    public static SampleData fromJson(String json) throws JsonProcessingException {
        ObjectMapper mapper = new ObjectMapper();
        return mapper.readValue(json, SampleData.class);
    }
}

这个方法包含两个方法，一个是将SampleData 转换成字符串，另一个是将字符串转成SampleData 对象。

序列化器

我们定义的数据源序列化器要实现AbstractDeserializationSchema接口，主要是通过deserialize方法将二进制数组转换成SampleData 对象。

src/main/java/org/example/serializer/SampleDataRabbitMQSourceSerializer.java

package org.example.serializer;

import org.apache.flink.api.common.serialization.AbstractDeserializationSchema;
import org.apache.flink.api.common.typeinfo.TypeInformation;
import org.example.vo.SampleData;

import java.io.IOException;

public class SampleDataRabbitMQSourceSerializer extends AbstractDeserializationSchema<SampleData> {
    @Override
    public SampleData deserialize(byte[] message) throws IOException {
        return SampleData.fromJson(new String(message));
    }

    @Override
    public boolean isEndOfStream(SampleData nextElement) {
        return false;
    }

    @Override
    public TypeInformation<SampleData> getProducedType() {
        return TypeInformation.of(SampleData.class);
    }
}

接入数据源

我们在《Java版Flink使用指南——定制RabbitMQ的Sink序列化器》一文中，往data.to.rbtmq对了写入了大量SampleData 数据。这次我们将其作为数据源来做测试
这次我们在创建RMQSource时传入序列化器SampleDataRabbitMQSourceSerializer。它会将从RabbitMQ获取的数据转换成SampleData对象。
然后我们获取所有“已婚”（filter.getMarried() == true）的数据，将其打印到日志中。

String queueName = "data.to.rbtmq";
String host = "172.21.112.140"; // IP of the rabbitmq server
int port = 5672;
String username = "admin";
String password = "fangliang";
String virtualHost = "/";
int parallelism = 1;

// create a RabbitMQ source
RMQConnectionConfig rmqConnectionConfig = new RMQConnectionConfig.Builder()
.setHost(host)
.setPort(port)
.setUserName(username)
.setPassword(password)
.setVirtualHost(virtualHost)
.build();

RMQSource<SampleData> rmqSource = new RMQSource<>(rmqConnectionConfig, queueName, true, new SampleDataRabbitMQSourceSerializer());
final DataStream<SampleData> stream = env.addSource(rmqSource).name(username + "'s source from " + queueName).setParallelism(parallelism);

stream.filter(filter -> filter.getMarried() == true).print().name(username + "'s sink to stdout").setParallelism(parallelism);

测试

修改Slot个数

由于我们要运行两个流式计算任务，于是需要两个Slot。

vim conf/config.yaml

将numberOfTaskSlots的值改成2。

打包、提交、运行

我们将本例和《Java版Flink使用指南——定制RabbitMQ的Sink序列化器》中的包都提交运行
在这里插入图片描述
然后在日志中可以看到“已婚”的数据都在输出

 tail -f log/*

在这里插入图片描述

工程代码

https://github.com/f304646673/FlinkDemo

原文地址：https://blog.csdn.net/breaksoftware/article/details/140077842

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Redis-Redis可视化工具Redis Insight下载及安装
下一篇：vivado DELAY_VALUE_XPHY、DIFF_TERM

Java反射
当我们的程序在运行后，第一次使用某个类的时候，会将此类的class文件读取到内存，并将此类的所有信息存储到一个Class对象中。
阅读更多2024-11-18
Maven 构建项目
除了 Maven 默认的生命周期外，你还可以在pom.xml中定义自定义目标和生命周期。例如，可以为某些自定义任务添加新阶段或目标。
阅读更多2024-11-18
丑数动态规划
【代码】丑数动态规划。
阅读更多2024-11-18
牛客挑战赛77
着重解释这一段代码这段代码的目的是计算每个位上所有数的贡献值，根据它们在k进制下的余数分布，进行不同余数之间和相同余数之间的组合计算。我们一段一段地分析这个代码。
阅读更多2024-11-18
【Spring】Bean的作用域和Spring的执行流程
本期讲解：Bean的作用域以及Spring的执行流程
阅读更多2024-11-18
vmware集群 vSAN HCL 数据库
VSAN版本目录升级。
阅读更多2024-11-18
网络安全技术概论知识点
3.缺陷：无法防范不经防火墙的攻击，防火墙是一种被动安全策略执行设备对新攻击无法防范，不能防止利用标准网络协议中的缺陷进行的攻击，不能防止利用服务器其系统漏洞进行的攻击，不能防止数据驱动式攻击，无法保
阅读更多2024-11-18
子网划分学习
255.0.0.0 //典型的a类地址，子网位是255，主机位全都是0，这里其实就只有一个子网，因为他好像没有借主机位的地址，可以用公式计算，2^0=1。30位的，那么最后8个0，占了6个，那么
阅读更多2024-11-18
21.UE5游戏存档，读档，函数库
这一节的内容较为错综复杂，中间没有运行程序进行阶段性成果的验证，只有全部敲完，才能够实现对应功能，所以最好一口气看到最后。
阅读更多2024-11-18
11.16 JavaScript
什么是JavaScript？ECMA：ECMA国际（前身为欧洲计算机制造商协会），制定了标准化的脚本程序设计语言ECMAScript，这种语言得到广泛应用。而JavaScript是遵守ECMAScri
阅读更多2024-11-18