【企业级分布式系统】ELK优化

🕗 发布于 2024-11-20 16:11 elk 运维 服务器 数据库 elasticsearch

文章目录

Elasticsearch作为日志存储时的优化

Elasticsearch作为日志存储时的优化

linux内核优化、JVM优化、ES配置优化、架构优化（filebeat/fluentd代替logstash、加入kafka做消息队列）

优化ES索引设置

（1）优化fsync

背景：Elasticsearch为保证数据不丢失，会在每次写请求完成后触发fsync将translog中的segment刷到磁盘。这提高了数据安全性，但可能影响性能。
优化建议：如果允许部分数据丢失以提高效率，可以设置异步刷新translog，并调整相关参数。
- "index.translog.durability": "async"：设置为异步刷新。
- "index.translog.flush_threshold_size":"1024mb"：增大translog刷新阈值。
- "index.translog.sync_interval": "120s"：延长translog同步间隔。

（2）优化refresh

背景：Elasticsearch通过refresh过程将内存中的数据转换成Lucene的完整segment，以便被搜索。默认1秒后数据可查询，但会产生大量segment，影响检索性能。
优化建议：对于日志搜索，可以适当增大refresh间隔。
- "index.refresh_interval":"5s"或更长，根据实际需求设置。

（3）优化merge

背景：merge操作会合并segment，优化索引结构。但并发merge可能占用过多资源，影响集群性能。
优化建议：控制并发的merge线程数，根据存储类型和CPU核数调整。
- "index.merge.scheduler.max_thread_count":"1"：对于普通磁盘，设置为1以减少IO堵塞。

（4）实施优化

需要先关闭索引，修改设置后再打开。
使用curl命令进行索引的关闭、设置修改和打开操作。

优化线程池配置

背景：write线程池满负荷时可能导致数据写入拒绝。
优化建议：
- 将线程数改为CPU总核数加1。
- 增大队列容量以缓冲任务，但避免过大导致堆内存占用过多。
在elasticsearch.yml文件中修改write线程池配置。

锁定内存，不让JVM使用Swap

背景：Swap交换分区对性能和节点稳定性不利，会导致垃圾回收时间延长和节点响应缓慢。
优化建议：
- 临时禁用Swap内存（重启后失效）。
- 永久减少Swap的使用（通过修改/etc/sysctl.conf文件）。
- 在elasticsearch.yml文件中启用bootstrap.memory_lock，锁定内存不让JVM写入Swap。

减少分片数、副本数

分片：
- 背景：分片过小可能导致开销增加，分片过大可能导致频繁Merge和大量IO操作。
- 优化建议：根据索引大小调整分片数，如15G以下的索引调整为3个分片。
副本数：
- 背景：过多副本会导致ES内部写扩大，影响写入性能。
- 优化建议：对于日志数据，设置1个副本即可。对于大数据量的索引，可以设置副本数为0以减少对性能的影响。

原文地址：https://blog.csdn.net/Karoku/article/details/143879624

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：海外招聘丨挪威科技大学 —博士候选人机器学习在晶体和连续介质可塑性中的应用
下一篇：从零开始打造个人博客：我的网页设计之旅

深入理解 AWS Route 53 加权路由策略：实现多区域负载均衡
在当今的云计算环境中，有效管理和分配流量对于确保应用程序的高可用性和性能至关重要。AWS Route 53 的加权路由策略提供了一个强大的工具来实现这一目标。在本文中，我们将深入探讨加权路由策略的概念
阅读更多2024-11-21
Elasticsearch：如何部署文本嵌入模型并将其用于语义搜索
如何部署文本嵌入模型并将其用于语义搜索。它使你能够生成文本的向量表示并对生成的向量执行向量相似性搜索。示例中使用的模型在上公开可用。该示例使用来自的公共数据集。它由来自 Microsoft Bing
阅读更多2024-11-21
深入理解CRC：通信可靠性的关键
循环冗余校验（CRC, Cyclic Redundancy Check）是现代数据传输和存储中不可或缺的技术，用于提高系统的可靠性和数据完整性。CRC的强大之处在于其能够高效检测并定位传输错误，确保数
阅读更多2024-11-21
低速接口项目之串口Uart开发(一)——串口UART
在 RS-232 标准中，最常用的配置是八个数据位+无奇偶校验+一个停止位，按照一个完整的字节包括一位起始位、8 位数据位、一位停止位即总共十位数据来算，要想完整的实现这十位数据的发送，就需要 11个
阅读更多2024-11-21
网络安全基础
相对性、时效性、相关性、不确定性、复杂性以及重要性等。指网络系统的硬件、软件及其系统中的数据受到保护，不因偶然的或者恶意的原因而遭受到破坏、更改、泄露，系统连续可靠正常地运行，网络服务不中断。1、机密
阅读更多2024-11-21
Docker1：认识docker、在Linux中安装docker
Docker：快速构建、运行、管理应用的工具。简单来说，帮助我们部署项目、以及项目依赖的各种组件。Docker是一个典型的运维工具。以上就是在Linux中，安装docker的全部详细过程，感兴趣就关注
阅读更多2024-11-21
基于Springboot+Vue医院急诊系统(源码+PPT+LW+调试部署)
基于Spring Boot + Vue的医院急诊系统，旨在为患者提供便捷的医院急诊服务，同时提升医院的信息化管理水平。系统分为前台和后台两部分，前台功能包括医生信息、医院病房、医院论坛、医院资讯、个人
阅读更多2024-11-21
Gin 框架中的表单处理与数据绑定
Gin框架允许注册自定义验证规则。import ("regexp"// 注册自定义验证规则})首先，根据表单的需要定义一个或多个结构体。这些结构体应该清晰地反映表单数据的结构和类型
阅读更多2024-11-21
CAAS 和 IAAS
和是两种云服务模式，分别代表不同层次的云计算服务。
阅读更多2024-11-21
Spark 分布式计算中网络传输和序列化的关系（二）
Spark 中序列化和网络传输的优化直接关系到分布式计算的整体性能。结合高效的序列化工具（如 Kryo）和合理的网络传输策略（如压缩、分区优化），可以显著提高数据处理效率。中，网络传输和序列化是数据处
阅读更多2024-11-21