如何优化Kafka消费者的性能

🕗 发布于 2024-11-13 08:22 kafka 分布式

在这里插入图片描述

要优化 Kafka 消费者性能，你可以考虑以下策略：

并行消费：通过增加消费者组中的消费者数量来并行处理更多的消息，从而提升消费速度。
批量消费：配置 fetch.min.bytes 和 fetch.max.wait.ms 参数来控制批量消费的大小和等待时间，减少网络开销。
手动提交偏移量：使用手动提交偏移量（通过设置 enable.auto.commit=false 并使用 commitSync 或 commitAsync 方法），提高消费的可靠性和灵活性。
优化配置：根据具体场景优化 Kafka 配置，如调整日志保留策略（log.retention.hours、log.retention.bytes 等）、消费者拉取策略（fetch.min.bytes、fetch.max.wait.ms 等）；根据实际需求设置合适的复制因子（replication.factor）和最小同步副本数（min.insync.replicas）等。
监控和维护：使用 Kafka 提供的 JMX（Java Management Extensions）指标，或集成第三方监控工具（如 Prometheus、Grafana）来实时监控 Kafka 集群的性能。
日志管理：定期检查和清理日志文件，确保磁盘空间充足。配置 log.cleanup.policy 参数（如 delete 或 compact）来控制日志清理策略。
集群维护：定期进行 Kafka 和 Zookeeper 集群的维护和升级，确保系统的稳定性和安全性。
分区设计：合理设计消息的分区策略，可以均衡负载，提升整体吞吐量。
批处理和压缩：启用数据压缩功能（如GZIP或Snappy），可以减少网络传输的数据量，进而提升吞吐量。
硬件资源优化：监控硬件资源使用情况，发现潜在的性能瓶颈；优化硬件配置和资源分配策略，确保资源得到充分利用。
Broker 配置调优：调整 Broker 配置，如 log.segment.bytes 优化日志存储结构，提升读写性能。
Zookeeper 优化：合理配置 Kafka 的副本数量和 ISR（In-Sync Replicas）列表，优化写入性能。

通过实施这些优化策略，你可以提升 Kafka 消费者性能，确保 Kafka 集群的高效运行。

package com.mita.web.core.config.kafka;

import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.TopicPartition;

import java.time.Duration;
import java.util.Collections;
import java.util.Properties;

/**
 * @author sunpeiyang
 * @date 2024/11/12 14:54
 */
public class KafkaConsumerDemo {
    public static void main(String[] args) {
        int numConsumers = 5; // 增加消费者的数量
        for (int i = 0; i < numConsumers; i++) {
            new Thread(new KafkaConsumerThread()).start();
        }
    }

    static class KafkaConsumerThread implements Runnable {
        private static final int ALERT_THRESHOLD = 1000; // 设置告警阈值

        @Override
        public void run() {
            // 配置消费者属性
            Properties props = new Properties();
            props.put("bootstrap.servers", "ip:9092");
            props.put("group.id", "test-group");
            props.put("enable.auto.commit", "true");
            props.put("auto.commit.interval.ms", "5000"); // 增加自动提交偏移量的间隔
            props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
            props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
            // 调整消费者配置
            props.put("fetch.min.bytes", "1"); // 减少最小获取字节数
            props.put("fetch.max.wait.ms", "100"); // 减少最大等待时间
            props.put("max.poll.records", "500"); // 增加一次拉取的最大记录数

            // 创建消费者实例
            KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);

            // 订阅主题
            consumer.subscribe(Collections.singletonList("test-topic"));

            // 消费消息
            while (true) {
                ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
                if (!records.isEmpty()) {
                    processRecords(records); // 异步处理消息
                    checkLag(ALERT_THRESHOLD, consumer, "test-topic"); // 检查滞后并告警
                    consumer.commitAsync(); // 异步提交偏移量
                }
            }
        }

        private void processRecords(ConsumerRecords<String, String> records) {
            // 异步处理消息的逻辑
            for (ConsumerRecord<String, String> record : records) {
                System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
                // 这里可以添加消息处理逻辑，例如使用线程池并行处理
            }
        }

        private void checkLag(int threshold, KafkaConsumer<String, String> consumer, String topic) {
            for (TopicPartition partition : consumer.assignment()) {
                long currentOffset = consumer.position(partition);
                long endOffset = consumer.endOffsets(Collections.singleton(partition)).values().iterator().next();
                long lag = endOffset - currentOffset;

                if (lag > threshold) {
                    System.out.printf("Alert: Consumer lag for partition %s is %d, which exceeds the threshold of %d%n", partition, lag, threshold);
                }
            }
        }
    }
}

以上代码基本上就能完全覆盖了相关kafka的性能优化，目前每秒的数据处理量是：一万条左右，正常业务足够用了

在这里插入图片描述

原文地址：https://blog.csdn.net/weixin_44372802/article/details/143719774

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

UML概述、类图关系及连接线表示
继承和实现体现的是一种类与类、或者类与接口间的纵向关系;依赖关联聚合组合体现的是类与类、类与接口间的引用，即横向关系;这几种关系，所表现的强弱程度依次为：组合 > 聚合 > 关联 >
阅读更多2024-11-17
131. HTML标签遮挡Canvas画布事件
HTML元素标签外面div父元素遮挡了Canvas画布鼠标事件，会造成相机控件的旋转、缩放等操作无效，也有可能会影响你的射线拾取,等等任何与canvas画布有关的鼠标事件都有可能收到影响，不过这算是普
阅读更多2024-11-17
Scala-字符串（拼接、printf格式化输出等）-用法详解
Scala-字符串（拼接、printf格式化输出等）用法
阅读更多2024-11-17
c++原型模式（Prototype Pattern）
每个原型类实现自己的克隆方法，从而确保了对象的正确复制。
阅读更多2024-11-17
问题大集-01-kafka问题
1、Windows下启动单机kafka出现：系统找不到指定路径解决：是kafka不能识别本机的java环境（JVM），故需要指定java路径，进入kafka路径下的\bin\windows，找到：ka
阅读更多2024-11-17
【点云上采样】最近邻插值上采样算法增加点云密度
传感器采集到的点云比较稀疏，毕竟价位在那，好的太贵，买便宜的点又太稀，需要增加点云数据。
阅读更多2024-11-17
阮一峰科技爱好者周刊（第 325 期）推荐工具：一个基于 Next.js 的博客和 CMS 系统
近期，阮一峰在科技爱好者周刊第 325 期中推荐了一款开源工具——ReactPress，ReactPress一个基于 Next.js 的博客和 CMS 系统，可查看 demo站点。（@fecommun
阅读更多2024-11-17
js识别二维码
将二维码转换为链接
阅读更多2024-11-17
C 语言【单链表】
‌数据域用于存储实际的数据，而指针域则存储指向下一个节点的地址。单链表的特点包括动态存储、非连续存储、易于插入和删除。节点可以定义成一个结构体，每个节点中包含一个数据和下一个节点的地址。上面的结构体定
阅读更多2024-11-17
校园求职招聘系统（程序+数据库+报告）
基于Spring Boot框架实现的校园求职招聘系统，系统包含两种角色：管理员、用户,系统分为前台和后台两大模块
阅读更多2024-11-17

如何优化Kafka消费者的性能

以上代码基本上就能完全覆盖了相关kafka的性能优化，目前每秒的数据处理量是： 一万条左右，正常业务足够用了

相关文章

以上代码基本上就能完全覆盖了相关kafka的性能优化，目前每秒的数据处理量是：一万条左右，正常业务足够用了