Python脚本消费多个Kafka topic

🕗 发布于 2024-11-22 12:26 python kafka 开发语言

在Python中消费多个Kafka topic，可以使用kafka-python库，这是一个流行的Kafka客户端库。以下是一个详细的代码示例，展示如何创建一个Kafka消费者，并同时消费多个Kafka topic。

1.环境准备

（1）安装Kafka和Zookeeper：确保Kafka和Zookeeper已经安装并运行。

（2）安装kafka-python库：通过pip安装kafka-python库。

bash复制代码

pip install kafka-python

2.示例代码

以下是一个完整的Python脚本，展示了如何创建一个Kafka消费者并消费多个topic。

from kafka import KafkaConsumer
import json
import logging
 
# 配置日志
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
)
logger = logging.getLogger(__name__)
 
# Kafka配置
bootstrap_servers = 'localhost:9092'  # 替换为你的Kafka服务器地址
group_id = 'multi-topic-consumer-group'
topics = ['topic1', 'topic2', 'topic3']  # 替换为你要消费的topic
 
# 消费者配置
consumer_config = {
    'bootstrap_servers': bootstrap_servers,
    'group_id': group_id,
    'auto_offset_reset': 'earliest',  # 从最早的offset开始消费
    'enable_auto_commit': True,
    'auto_commit_interval_ms': 5000,
    'value_deserializer': lambda x: json.loads(x.decode('utf-8'))  # 假设消息是JSON格式
}
 
# 创建Kafka消费者
consumer = KafkaConsumer(**consumer_config)
 
# 订阅多个topic
consumer.subscribe(topics)
 
try:
    # 无限循环，持续消费消息
    while True:
        for message in consumer:
            topic = message.topic
            partition = message.partition
            offset = message.offset
            key = message.key
            value = message.value
 
            # 打印消费到的消息
            logger.info(f"Consumed message from topic: {topic}, partition: {partition}, offset: {offset}, key: {key}, value: {value}")
 
            # 你可以在这里添加处理消息的逻辑
            # process_message(topic, partition, offset, key, value)
 
except KeyboardInterrupt:
    # 捕获Ctrl+C，优雅关闭消费者
    logger.info("Caught KeyboardInterrupt, closing consumer.")
    consumer.close()
 
except Exception as e:
    # 捕获其他异常，记录日志并关闭消费者
    logger.error(f"An error occurred: {e}", exc_info=True)
    consumer.close()

3.代码解释

（1）日志配置：使用Python的logging模块配置日志，方便调试和记录消费过程中的信息。

（2）Kafka配置：设置Kafka服务器的地址、消费者组ID和要消费的topic列表。

（3）消费者配置：配置消费者参数，包括自动重置offset、自动提交offset的时间间隔和消息反序列化方式（这里假设消息是JSON格式）。

（4）创建消费者：使用配置创建Kafka消费者实例。

（5）订阅topic：通过consumer.subscribe方法订阅多个topic。

（6）消费消息：在无限循环中消费消息，并打印消息的详细信息（topic、partition、offset、key和value）。

（7）异常处理：捕获KeyboardInterrupt（Ctrl+C）以优雅地关闭消费者，并捕获其他异常并记录日志。

4.运行脚本

确保Kafka和Zookeeper正在运行，并且你已经在Kafka中创建了相应的topic（topic1、topic2、topic3）。然后运行脚本：

bash复制代码

python kafka_multi_topic_consumer.py

这个脚本将开始消费指定的topic，并在控制台上打印出每条消息的详细信息。你可以根据需要修改脚本中的处理逻辑，比如将消息存储到数据库或发送到其他服务。

5.参考价值和实际意义

这个示例代码展示了如何在Python中使用kafka-python库消费多个Kafka topic，适用于需要处理来自不同topic的数据流的场景。例如，在实时数据处理系统中，不同的topic可能代表不同类型的数据流，通过消费多个topic，可以实现数据的整合和处理。此外，该示例还展示了基本的异常处理和日志记录，有助于在生产环境中进行调试和监控。

文章转载自：TechSynapse

原文链接：https://www.cnblogs.com/TS86/p/18559602

体验地址：引迈 - JNPF快速开发平台_低代码开发平台_零代码开发平台_流程设计器_表单引擎_工作流引擎_软件架构

原文地址：https://blog.csdn.net/dsgdauigfs/article/details/143936212

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【ARM Coresight OpenOCD 系列 6.1 -- JTAG Commands】
下一篇：使用Java爬虫时，有哪些性能优化技巧？

Windows电脑本地部署llamafile并接入Qwen大语言模型远程AI对话实战
Windows电脑本地部署llamafile并接入Qwen大语言模型远程AI对话实战
阅读更多2024-11-23
解决vm虚拟机中ctrl键粘滞问题（一直处于按下状态）
虚拟机中点击鼠标左键没有问题，单独按下键盘也没有问题，但是如果按下键盘的同时在按下鼠标左键就会卡住。而且100%稳定复现。发现问题原因：vm版本的问题，我的版本是17.5.0，升级成17.5.2 bu
阅读更多2024-11-23
第十章 JavaScript的应用
10.1.1 JavaScript简介1 简单性JavaScript 设计之初就考虑到了非专业程序员的使用，因此它的语法相对简单，容易上手。2 动态性JavaScript 是一种解释型语言，代码可以在
阅读更多2024-11-23
非root用户安装CUDA
4.下载完成后执行.run文件，需要添加两个参数，一个是--override，用于跳过某些检查或限制；另一个是--toolkitpath，它表示安装路径，必须是自己目录下面的路径，如果是根目录就会安装
阅读更多2024-11-23
Python操作neo4j库py2neo使用之py2neo 删除及事务相关操作（三）
【代码】## Python操作neo4j库py2neo使用之py2neo 删除及事务相关操作（三）
阅读更多2024-11-23
【通俗理解】Jensen不等式与变分分布q(z)在积分计算中的应用
Jensen不等式 #变分分布 #积分计算 #期望 #凸函数 #优化问题 #下界估计 #机器学习。
阅读更多2024-11-23
「Mac玩转仓颉内测版27」基础篇7 - 字符串类型详解
本篇将介绍 Cangjie 中的字符串类型，包括字符串的定义、字面量形式、插值表达、常用操作及应用场景，帮助开发者熟练掌握字符串的使用。
阅读更多2024-11-23
数据科学与SQL：组距分组分析 | 区间分布问题
绝对值分布分析也可以理解为组距分组分析。对于某个指标而言，一个记录对应的指标值的绝对值，肯定落在所有指标值的绝对值的最小值和最大值构成的区间内，根据一定的算法，在把这个区间划分为等距离的几个小区间，，
阅读更多2024-11-23
c++编译报C1004错误的原因及解决办法
可能是你的代码文件最后没有正确的结束符，或者是缺少了一些必要的头文件或语句。默认磁盘驱动器没有足够的空间用于临时文件，需要大约两倍于源文件的空间。编译器到达了源文件尾但未解析构造。计算结果为假的 #i
阅读更多2024-11-23
mysql 去重补全取出重复变量函数和存储过程
mysql 去重补全取出重复变量函数和存储过程
阅读更多2024-11-23