Kafka 在 Linux 下的集群配置和安装

🕗 发布于 2024-09-27 07:21 kafka linux java 面试系统架构

Kafka 在 Linux 下的集群配置和安装

Apache Kafka 是一个流行的分布式流处理平台，广泛用于实时数据管道和流处理应用。本文将详细讲解如何在 Linux 环境中配置和安装 Kafka 集群，并包括通过 Docker 安装和配置 Kafka 的步骤。每个步骤都将提供详细的解释，力求帮助读者深入理解。

1. 环境准备

在开始之前，请确保您的 Linux 系统满足以下要求：

操作系统：推荐使用 Ubuntu 20.04 或 CentOS 7/8。
Java：Kafka 需要 Java 8 或更高版本。
Zookeeper：Kafka 使用 Zookeeper 来管理集群。

1.1 安装 Java

首先，确保安装了 Java。如果尚未安装，可以使用以下命令进行安装。

对于 Ubuntu：

sudo apt update
sudo apt install openjdk-11-jdk -y

对于 CentOS：

sudo yum install java-11-openjdk-devel -y

验证安装：

java -version

1.2 安装 Zookeeper

Kafka 需要 Zookeeper 来管理集群。您可以选择单独安装 Zookeeper，或让 Kafka 自带的 Zookeeper 实例运行。

使用单独的 Zookeeper 安装

下载 Zookeeper：

wget https://downloads.apache.org/zookeeper/zookeeper-3.7.1/apache-zookeeper-3.7.1-bin.tar.gz

解压并移动到合适的目录：

tar -xzf apache-zookeeper-3.7.1-bin.tar.gz
sudo mv apache-zookeeper-3.7.1-bin /opt/zookeeper

配置 Zookeeper：创建一个配置文件 zoo.cfg：

sudo nano /opt/zookeeper/conf/zoo.cfg

添加以下内容：

tickTime=2000  # Zookeeper 心跳时间
dataDir=/opt/zookeeper/data  # 数据存储目录
clientPort=2181  # 客户端连接 Zookeeper 的端口
maxClientCnxns=60  # 最大客户端连接数

创建数据目录：
```
sudo mkdir /opt/zookeeper/data
```
启动 Zookeeper：
```
/opt/zookeeper/bin/zkServer.sh start
```

验证 Zookeeper 是否启动成功：

/opt/zookeeper/bin/zkServer.sh status

2. Kafka 安装

下载 Kafka：

wget https://downloads.apache.org/kafka/3.1.0/kafka_2.12-3.1.0.tgz

解压并移动到合适的目录：

tar -xzf kafka_2.12-3.1.0.tgz
sudo mv kafka_2.12-3.1.0 /opt/kafka

配置 Kafka： Kafka 的配置文件在 /opt/kafka/config/server.properties 中。打开该文件：

sudo nano /opt/kafka/config/server.properties

修改以下配置项，并附上说明：

broker.id=0  # 每个 Broker 的唯一 ID，用于标识不同的 Broker
listeners=PLAINTEXT://:9092  # Broker 监听的地址和端口
log.dirs=/opt/kafka/logs  # Kafka 日志存储目录，存放消息的实际文件
zookeeper.connect=localhost:2181  # Zookeeper 地址，用于 Kafka 连接到 Zookeeper

创建 Kafka 日志目录：
```
sudo mkdir /opt/kafka/logs
```

启动 Kafka：

/opt/kafka/bin/kafka-server-start.sh /opt/kafka/config/server.properties

验证 Kafka 是否成功启动：

/opt/kafka/bin/kafka-topics.sh --list --zookeeper localhost:2181

3. Kafka 集群配置

在生产环境中，Kafka 通常运行在多台机器上。以下是如何配置 Kafka 集群的步骤：

3.1 多个 Broker 配置

假设我们要在三台机器上配置 Kafka 集群，分别为 Broker 1、Broker 2 和 Broker 3。

Broker 1：

配置文件：

broker.id=0
listeners=PLAINTEXT://:9092
log.dirs=/opt/kafka/logs
zookeeper.connect=localhost:2181

Broker 2：

配置文件：

broker.id=1
listeners=PLAINTEXT://:9093
log.dirs=/opt/kafka/logs
zookeeper.connect=localhost:2181

Broker 3：

配置文件：

broker.id=2
listeners=PLAINTEXT://:9094
log.dirs=/opt/kafka/logs
zookeeper.connect=localhost:2181

确保每个 Broker 的 broker.id 唯一，并且监听的端口不同。

启动每个 Broker：

/opt/kafka/bin/kafka-server-start.sh /opt/kafka/config/server.properties

4. 使用 Docker 安装和配置 Kafka

使用 Docker 可以简化 Kafka 和 Zookeeper 的安装与管理。以下是使用 Docker 安装 Kafka 的步骤：

4.1 安装 Docker 和 Docker Compose

安装 Docker：对于 Ubuntu：

sudo apt update
sudo apt install docker.io -y

对于 CentOS：

sudo yum install docker -y

安装 Docker Compose：

sudo curl -L "https://github.com/docker/compose/releases/download/1.29.2/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
sudo chmod +x /usr/local/bin/docker-compose

4.2 创建 Docker Compose 配置

创建一个目录来存放 Docker Compose 文件：
```
mkdir kafka-docker
cd kafka-docker
```

创建 docker-compose.yml 文件：

version: '2'
services:
  zookeeper:
    image: wurstmeister/zookeeper:3.4.6
    ports:
      - "2181:2181"  # Zookeeper 端口映射
  kafka:
    image: wurstmeister/kafka:latest
    ports:
      - "9092:9092"  # Kafka 端口映射
    expose:
      - "9093"
    environment:
      KAFKA_ADVERTISED_LISTENERS: INSIDE://kafka:9093,OUTSIDE://localhost:9092
      KAFKA_LISTENER_SECURITY_PROTOCOL_MAP: INSIDE:PLAINTEXT,OUTSIDE:PLAINTEXT
      KAFKA_LISTENERS: INSIDE://0.0.0.0:9093,OUTSIDE://0.0.0.0:9092
      KAFKA_ZOOKEEPER_CONNECT: zookeeper:2181  # Zookeeper 连接配置
    depends_on:
      - zookeeper  # Kafka 启动前依赖 Zookeeper

启动 Docker Compose：
```
sudo docker-compose up -d
```
验证 Kafka 是否成功启动：
```
sudo docker-compose logs kafka
```

5. 创建主题

无论是直接安装还是通过 Docker，创建主题的命令是相同的。

/opt/kafka/bin/kafka-topics.sh --create --topic test-topic --bootstrap-server localhost:9092 --replication-factor 1 --partitions 3

6. 生产者和消费者

6.1 启动生产者

您可以使用 Kafka 自带的命令行工具启动生产者：

/opt/kafka/bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test-topic

6.2 启动消费者

使用以下命令启动消费者以接收消息：

/opt/kafka/bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test-topic --from-beginning

7. 监控与管理

监控 Kafka 集群的健康状态是确保其高可用性和性能的关键。可以使用多种工具来实现这一目标，其中 Kafka Manager 和 Confluent Control Center 是最常用的选项。下面将详细介绍这两个工具的使用，包括安装、配置和具体案例。

7.1 Kafka Manager

概述： Kafka Manager 是一个开源工具，可以帮助用户监控和管理 Kafka 集群。它提供了直观的用户界面，允许用户查看集群状态、主题信息、消费者组等。

安装步骤：

下载 Kafka Manager：

wget https://github.com/yahoo/kafka-manager/releases/download/2.0.0/kafka-manager-2.0.0.zip
unzip kafka-manager-2.0.0.zip
cd kafka-manager-2.0.0

配置 Kafka Manager：编辑 conf/application.conf 文件，配置 Kafka 集群的信息：
```
kafka-manager.zkhosts="localhost:2181"
```
启动 Kafka Manager：使用以下命令启动 Kafka Manager：
```
bin/kafka-manager
```
默认情况下，Kafka Manager 监听在 9000 端口。
访问 Kafka Manager：在浏览器中访问 http://localhost:9000，然后添加 Kafka 集群。

使用案例：

监控集群状态：通过 Kafka Manager 的 UI，可以查看集群的健康状态，如 Broker 的在线/offline 状态、每个主题的分区情况、消费者组的 lag（延迟）。
处理分区再平衡：如果某个 Broker 的负载过高，可以通过 Kafka Manager 的分区再平衡功能，将一些分区迁移到其他 Broker，以实现负载均衡。

7.2 Confluent Control Center

概述： Confluent Control Center 是 Confluent 提供的一个高级监控工具，适用于 Kafka 和相关组件。它提供了更加丰富的监控和管理功能，包括数据流监控、性能指标、流应用监控等。

安装步骤：

下载 Confluent Platform：访问 Confluent 官网下载最新版本的 Confluent Platform。

解压并配置：

tar -xzf confluent-<version>.tar.gz
cd confluent-<version>

启动 Confluent Control Center：编辑 etc/confluent-control-center/control-center.properties 文件，配置 Kafka 和 Schema Registry 的连接信息：
```
bootstrap.servers=localhost:9092
confluent.control.center.schema.registry.url=http://localhost:8081
```
然后运行以下命令启动 Control Center：
```
bin/confluent start
```
访问 Confluent Control Center：在浏览器中访问 http://localhost:9021，即可看到控制中心的仪表盘。

使用案例：

实时监控： Control Center 提供实时的数据流监控功能，可以查看数据流的速率、延迟和消费者 lag 等重要指标。
性能调优：通过监控数据，用户可以识别出性能瓶颈，并对生产者和消费者的配置进行优化，以提升整体性能。
报警设置：可以设置报警规则，当某些关键指标（如消息延迟、处理速率等）超出预设范围时，系统会自动发送通知。

7.3 具体案例

假设你正在运行一个电商平台，使用 Kafka 作为消息队列。在高峰购物季节，你需要确保系统的稳定性和响应速度。

使用 Kafka Manager：

通过 Kafka Manager，你发现某个 Broker 的 CPU 使用率接近 100%，而其他 Broker 的负载较低。你决定将某些分区从负载过重的 Broker 迁移到其他 Broker。

使用 Confluent Control Center：

在 Confluent Control Center 中，监控到订单消息的处理延迟突然增加。你检查发现是某个消费者组的 lag 较高，通过性能监控工具分析，发现是由于处理逻辑中的一个性能瓶颈导致的。你及时调整了代码，降低了处理时间，最终将延迟恢复到正常水平。

通过以上监控工具的使用，能够帮助团队更快地识别问题、进行性能优化，确保 Kafka 集群的高效运行。

8. 故障排查

在 Kafka 集群的使用中，可能会遇到一些常见问题及其解决方案。以下是对每个问题的详细描述、解决方法以及具体案例，以帮助更好地理解和解决这些问题。

8.1 Zookeeper 不可用

问题描述：如果 Zookeeper 未启动，Kafka 将无法连接到 Zookeeper，导致 Broker 启动失败。在启动 Kafka 时，如果控制台输出类似于“Failed to connect to Zookeeper”的错误信息，则表示 Zookeeper 可能未运行。
解决方法：
1. 检查 Zookeeper 状态：
```
/opt/zookeeper/bin/zkServer.sh status
```
  如果输出为“Error contacting service. It is probably not running.”，则表示 Zookeeper 未运行。
2. 启动 Zookeeper：
```
/opt/zookeeper/bin/zkServer.sh start
```
3. 重新启动 Kafka Broker。
具体案例：假设在启动 Kafka Broker 时出现了以下错误：
```
css复制代码[ERROR] Failed to connect to Zookeeper: localhost:2181
```
通过执行 zkServer.sh status 发现 Zookeeper 没有运行，启动 Zookeeper 后，Kafka Broker 成功启动。

8.2 Broker 启动失败

问题描述：Broker 启动时可能因为配置错误而失败，尤其是 Zookeeper 地址不正确。启动日志中通常会显示有关配置错误的提示。
解决方法：
1. 查看 Broker 日志文件：
```
cat /opt/kafka/logs/server.log
```
  检查是否有关于 Zookeeper 连接失败的错误信息。
2. 检查配置文件 /opt/kafka/config/server.properties 中的 Zookeeper 地址：
```
zookeeper.connect=localhost:2181  # 确保地址和端口正确
```
具体案例：如果 Broker 启动时日志中显示：
```
[ERROR] Zookeeper is not available
```
通过检查 Zookeeper 的地址发现设置为 zookeeper.connect=127.0.0.1:2182，修改为 localhost:2181 并重启 Broker 后，问题解决。

8.3 消息丢失

问题描述：如果主题的副本因子设置不合理，可能会导致消息丢失，尤其是在 Broker 故障的情况下。如果 Broker 故障，而主题只在单个 Broker 上有副本，则会丢失该 Broker 上的消息。
解决方法：
1. 确保主题的副本因子设置合理：
```
/opt/kafka/bin/kafka-topics.sh --describe --topic test-topic --bootstrap-server localhost:9092
```
  检查输出中的 ReplicationFactor 是否大于1。
2. 调整主题副本因子：
```
/opt/kafka/bin/kafka-topics.sh --alter --topic test-topic --partitions 3 --replication-factor 2 --bootstrap-server localhost:9092
```
3. 确保 Producer 配置适当的 acks 策略：
  - 使用 acks=all 来确保消息被所有副本确认。
具体案例：如果在生产环境中遇到消息丢失，检查主题配置，发现副本因子为1。在增加副本因子到2后，再进行测试，发现消息成功写入，且在一个 Broker 故障的情况下仍然能正常读取。

8.4 网络问题

问题描述：在分布式环境中，网络故障可能导致消息未能发送或接收。常见的症状包括生产者发送消息后未能在消费者端接收。
解决方法：
1. 检查 Broker 和 Zookeeper 之间的网络连接：
```
ping <broker-ip>  # 检查 Broker 是否可达
```
2. 确保防火墙规则允许 Kafka 和 Zookeeper 的端口（如 9092 和 2181）：
```
sudo ufw allow 9092
sudo ufw allow 2181
```
3. 使用工具如 telnet 或 nc 测试端口连接：
```
telnet localhost 9092
```
具体案例：如果消费者无法接收到生产者发送的消息，检查网络配置，发现 Broker 所在机器的防火墙阻止了 9092 端口的流量。开放该端口后，消费者成功接收到了消息。

8.5 性能问题

问题描述：在高负载情况下，Kafka 可能会遇到消息延迟或处理速度慢的问题。这可能是由于 Broker 资源不足、网络瓶颈或不合理的配置导致的。
解决方法：
1. 监控 Kafka 集群的性能指标，使用工具如 Kafka Manager 或 JMX Exporter。
2. 增加 Broker 数量，分散负载：
  - 添加新的 Broker 并更新 Zookeeper 配置。
3. 优化生产者和消费者的配置：
  - 增加批量发送大小（batch.size）和消息压缩（compression.type）以提高吞吐量。
  - 调整消费者的 max.poll.records 来控制每次处理的消息数量。
具体案例：在高峰期发现消息处理延迟达到了几分钟，通过监控工具确认 CPU 和内存利用率接近上限。增加了两个新的 Broker，并调整了生产者的 batch.size 和 linger.ms 配置后，延迟显著降低。

9. Kafka 与其他开源消息队列框架的区别

9.1 Kafka

优点：

高吞吐量：Kafka 设计用于处理大规模数据流，能以高吞吐量处理消息。
持久化与可靠性：Kafka 提供持久化存储，支持数据备份和容错机制，通过副本机制确保数据不丢失。
横向扩展：Kafka 支持简单的横向扩展，用户可以通过添加 Broker 来增加处理能力。
流处理能力：与 Kafka Streams 结合，Kafka 可以进行复杂的流处理操作。

缺点：

学习曲线：Kafka 的配置和使用相对复杂，对于新手来说，学习成本较高。
延迟：虽然吞吐量高，但在某些情况下，消息的处理延迟可能较高，尤其是在严格的顺序消费场景下。

使用场景：

实时数据处理与分析，例如日志收集、流数据处理。
需要高吞吐量和持久性的应用场景，如电商交易系统、监控系统。

9.2 RabbitMQ

优点：

易用性：RabbitMQ 提供友好的管理界面，易于配置和使用。
灵活的路由机制：支持多种消息传递协议和路由策略（如主题、队列、发布/订阅等）。
低延迟：在某些使用场景下，RabbitMQ 的消息传递延迟低于 Kafka。

缺点：

吞吐量限制：相比 Kafka，RabbitMQ 的吞吐量较低，可能在高并发情况下表现不佳。
复杂的持久化：RabbitMQ 的持久化配置较为复杂，不当配置可能导致数据丢失。

使用场景：

需要复杂路由和优先级队列的场景，如任务调度、即时消息传递。
适合小型应用或低延迟需求的实时系统。

9.3 ActiveMQ

优点：

支持多种协议：ActiveMQ 支持多种消息协议，如 JMS、AMQP、MQTT 等，兼容性强。
丰富的特性：提供消息分组、延迟队列等丰富功能，适合多样化需求。

缺点：

性能问题：在高负载场景下，ActiveMQ 的性能可能会下降，吞吐量不如 Kafka。
管理复杂：管理和配置较为复杂，特别是在集群环境中。

使用场景：

适合需要多种协议支持的企业级应用。
对于需要可靠性和消息传递顺序的场景。

10. 总结

本文详细介绍了在 Linux 环境中配置和安装 Kafka 集群的过程，包括每个配置项的说明和常见故障的排查方法。通过这些步骤，您可以轻松地构建一个可靠的 Kafka 集群，支持大规模数据流处理和实时数据传输。希望这篇文章能够帮助您顺利搭建和管理 Kafka 集群。

原文地址：https://blog.csdn.net/weixin_39996520/article/details/142577959

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Spire.PDF for .NET【页面设置】演示：对PDF 文件进行分页
下一篇：8.7基于数学形态学的边缘检测

网络安全在线网站/靶场：全面探索与实践
CyberPatriot 是由美国空军协会（AFA）赞助的一项全国性网络安全教育计划，主要面向中小学生。该平台通过模拟真实的网络环境，帮助学生们学习如何检测和防御网络攻击。
阅读更多2024-11-17
Javascript垃圾回收机制-运行机制（大厂内部培训版本）
分代式机制把一些新、小、存活时间短的对象作为新生代，采用一小块内存频率较高的快速清理，而一些大、老、存活时间长的对象作为老生代，使其很少接受检查，新老生代的回收机制及频率是不同的，可以说此机制的出现很
阅读更多2024-11-17
算法练习：438. 找到字符串中所有字母异位词
找到字符串中所有字母异位词详解
阅读更多2024-11-17
ubuntu固定ip
ifconfig。
阅读更多2024-11-17
【每日 C/C++ 问题】
适用于两个相关的类型之间的自动转换，类型不相关时编译器会识别出来并报错。
阅读更多2024-11-17
sb.append(a + b)；与sb.append(a).append(b)；详解
sb.append(a + b);与sb.append(a).append(b); 详解
阅读更多2024-11-17
Java学习教程，从入门到精通，Java中super关键字的语法知识点及案例（31）
super是Java中的一个关键字，主要用于引用当前对象的父类或超类。通过super，可以在子类中访问父类的成员变量、方法和构造函数。
阅读更多2024-11-17
6. Keepalived配置Nginx自动重启，实现7x24提供服务
Keepalived配置Nginx自动重启，实现7x24提供服务实现步骤
阅读更多2024-11-17
unity3d————场景异步加载
本文介绍了Unity中场景切换的两种方法：同步切换和异步切换。同步切换在切换场景时会删除当前场景的所有对象并加载下一个场景的信息，可能导致卡顿。因此，异步切换被引入来解决这个问题。异步切换有两种实现方
阅读更多2024-11-17
Android Studio 控制台输出的中文显示乱码
安卓在调试阶段，需要查看app运行时的输出信息、出错提示信息。乱码，会极大的阻碍开发者前进的信心，不能及时的根据提示信息定位问题，因此我们需要查看没有乱码的打印信息。代码运行报错的时候，Build O
阅读更多2024-11-17

Kafka 在 Linux 下的集群配置和安装

Kafka 在 Linux 下的集群配置和安装

1. 环境准备

1.1 安装 Java

1.2 安装 Zookeeper

使用单独的 Zookeeper 安装

2. Kafka 安装

3. Kafka 集群配置

3.1 多个 Broker 配置

4. 使用 Docker 安装和配置 Kafka

4.1 安装 Docker 和 Docker Compose

4.2 创建 Docker Compose 配置

5. 创建主题

6. 生产者和消费者

6.1 启动生产者

6.2 启动消费者

7. 监控与管理

7.1 Kafka Manager

7.2 Confluent Control Center

7.3 具体案例

8. 故障排查

8.1 Zookeeper 不可用

8.2 Broker 启动失败

8.3 消息丢失

8.4 网络问题

8.5 性能问题

9. Kafka 与其他开源消息队列框架的区别

9.1 Kafka

9.2 RabbitMQ

9.3 ActiveMQ

10. 总结

相关文章