“Kafka面试攻略：核心问题与高效回答”

🕗 发布于 2024-11-21 23:33 kafka 面试分布式

1，生产者发送消息的原理

发送消息的过程中，涉及到两个线程，main线程和sender线程，main线程会创建一个双端队列，main线程向双端队列发送消息，sender线程从双端队列里拉取消息，发送给Kafka Broker。

2，如何给数据去重

幂等性就是指生产者不论向Broker发送多少次重复数据，Broker端都只会持久化一条，保证了数据不重复

ACK级别调成-1，分区的副本数要大于等于二，ISR最小副本数也要大于等于二

什么是ISR ISR就是指只保留存活的leader和follower的队列

3，如何保证数据的安全性

kafka提供了三种ACK级别

1，acks=0：生产者向leader发送消息不会等待应答，认为消息发送成功，这种方式效率较高，可靠性最差，可能导致数据的丢失。

2，acks=1：生产者向leader发送消息给leader，leader拿到数据后应答之后挂掉了还没来得及同步给follower，但是生产者接到应答后觉得已经发送成功了，这个leader挂掉后会重新选举一个leader，这个时候leader向生产者要数据，但是生产者觉得已经发送成功了，就不会给新的leader发数据，导致数据的丢失

3，acks=-1，生产者向leader发送消息，leader开始同步给其他的follower，leader和ISR队列里面的所有节点收齐数据后应答，否则不会走，但是此时有一个follower出问题了迟迟同步不了，这个时候就需要用到ISR,ISR里面都是存活的leader，如果有follower挂了就会被踢出ISR队列。默认时间是30秒。

这还不是最可靠的

数据完全可靠的条件=ACK级别设置为-1+分区副本数大于等于二ISR里面应答的最小副本数大于等于2

4.如何解决数据积压的问题？

1，如果是Kafka的消费能力不足，则可以考虑增加主题Topic的分区数，并同时提升消费组的消费者数量。

2，如果是下游的数据处理不及时；提高每批次拉取的数量，批次拉取数据过少使处理的数据小于生产的数据，也会数据积压。

5，Kafka对leader的选举机制。

Kafka集群中会有一个broker的Controller会被选举位controller leader，负责管理集群broker的上下线，所有topic分区副本分配和leader选举。

leader的选举规则：首先要在ISR里存活，按照ar的排名在前的优先。

6，Kafka如何提高吞吐量？

1，如果是生产者要提高吞吐量的话，

首先要调整batch.size的大小，默认的批次是16k，linger.ms等待时间，，修改为5-100ms，compression.cype:压缩snappy，设置缓冲区大小RecordAccumlator 修改为64m。

2，如果是要提高消费者吞吐量的话，

1，如果是Kafka的消费能力不足，则可以考虑增加主题Topic的分区数，并同时提升消费组的消费者数量。

2，如果是下游的数据处理不及时；提高每批次拉取的数量，批次拉取数据过少使处理的数据小于生产的数据，也会数据积压。

7，如何做到高效读写数据

因为Kafka本身是分布式集群，可以采用分区技术，并行度高，读写数据采用稀疏索引，可以快速定位要消费的数据，顺写磁盘，页缓存+零拷贝技术。

8，offect机制

我们要如何指定offect消费

Kafka提供了seek方法，可以让我们从分区位置开始消费。

面试题：问：假如 kafka 崩了，重启之后，想继续消费，怎么做？

1、确定要消费的主题是哪几个

2、使用命令或者其他的组件查看 __consumer_offset 主题下的偏移量信息，找到我们关心的主题再崩溃之前消费到了哪里。

3、使用 java 代码，里面有一个非常重要的方法 seek，指定需要消费的主题，分区以及偏移量，就可以继续消费了。

offect位移

记录消费到哪里的这个值，就是偏移量。

记录：哪个主题，哪个分区，哪个位置。

原文地址：https://blog.csdn.net/GDDGHS_/article/details/143923635

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：BIM技术方案，GIS系统技术方案，三维仿真（PPT，word）
下一篇：OceanBase Shell开放内核运维接口，运维更便捷

JavaScript介绍
介绍js和js主要内容。
阅读更多2024-11-27
汽车维修管理系统｜Java｜SSM｜VUE｜前后端分离
3⃣️：员工端：首页、个人中心、维修项目管理、车辆信息管理、维修预约管理、汽车修理单管理、配件领用管理、汽车修理台账管理、汽车配件库存管理、采购进货单管理、配件申请管理。2⃣️：管理端：首页、个人中心
阅读更多2024-11-27
Vue el-input 校验输入数字和小数点，首位数字不能为0
为了使这个函数能够处理小数点输入，我们需要调整验证逻辑。
阅读更多2024-11-27
金融租赁系统助力企业升级与风险管理的新篇章
金融租赁系统在现代企业运营中发挥着重要作用，通过优化资金配置和资源利用，助力企业实现升级与转型。系统的先进风控模型能够有效管理风险，同时提高业务处理效率，使企业在竞争中更具优势。此外，金融租赁的灵活性
阅读更多2024-11-27
平安养老险20年：专业书写“养老金融”答卷
中国养老金融走过20年历程中，一家金融强企正是伴随着养老金融产业从诞生走向成熟。去年，中央金融工作会议将“养老金融”列入“五篇大文章”之一。回望20年前，中国“养老金融”便已悄然发轫。2004年，“企
阅读更多2024-11-27
金融数据中心容灾“大咖说” | Commvault的“网络弹性”之道
中国人民银行发布的《金融数据中心容灾建设指引》（JR/T 0264—2024）已于2024年7月29日正式实施。这一金融行业标准对金融数据中心容灾建设中的“组织保障、需求分析、体系规划、建设要求、运维
阅读更多2024-11-27
Vercel 设置自动部署 GitHub 项目
通过配置 Vercel Deploy Hooks 和 GitHub Webhooks，可在免费计划下实现代码推送后自动触发部署。
阅读更多2024-11-27
java基础概念38：正则表达式3-捕获分组
捕获分组，非捕获分组
阅读更多2024-11-27
stm32 指定变量存储地址
指定变量存储地址__attribute__((at(0x20000000)))
阅读更多2024-11-27
LVGL加载器，led和列表学习（基于正点原子）
* 设置主体圆弧宽度 */ lv_obj_set_style_arc_width( spinner, 30, LV_PART_INDICATOR );
阅读更多2024-11-27