redis 性能优化一

🕗 发布于 2024-03-07 10:27 redis 性能优化 redis 尾延迟 redis cpu 核绑定 redis

前言

说到redis 性能优化，优化的目的是什么？提高响应，减少延迟。就要关注两点，一是尾延迟，二是Redis 的基线性能。只有指标，我们的优化，才有意义，才能做监控以及报警。这些指标需要借助一定工具进行压力测试，高于这个值就说明需要优化了，这些值，不是绝对的，不同的服务器配置，都会有一些变化，下面我将介绍这两点。

尾延迟

不同公司，不同业务有不同的要求。比如有些公司要求redis 的请求 99% 的 GET 请求要小于400微妙，PUT 请求要小于500微妙。99% 是什么呢？比如说，我们有1000个请求，假设按请求延迟从小到大排序后，第 991 个请求的延迟实测值是 1ms，而前 990 个请求的延迟都小于 1ms，所以，这里 99% 尾延迟就是 1ms。这就是尾延迟，我们必须要把前991个请求的延迟时间在我们的要求范围内。

对于这个问题，我们该怎么优化呢？可以从下面这几个方面考虑

降低操作命令的复杂度
同时关闭RDB 和 AOF
一个 Redis 实例对应绑一个物理核

第1点有点难，操作命令复杂度其实与业务有关，但是也可以考虑用复杂度低的操作，这个看业务

第2点根据业务和架构，如果redis 不是主从也不是集群以及这些数据不需要实例话，那么可以关闭RDB和AOF的

第3点我只想稍微解释下，需要大家对cpu 的结构有一定的理解，我从网上找了一个cpu架构图。

上图中第一个L3 cache 代表第一个cpu，第二哥 L3 cache 代表第二个cpu。每个cpu 都有两个物理核。

上面是多cpu 架构，在多cpu架构上，应用程序可以在不同的处理器上运行。也就是说Redis 可以现在第一个cpu 上运行一段时间，然后在被调度到第二个cpu 运行。Redis 现在第一个cpu 上运行，并且把数据保持到了L1,L2 ,L3 cache。然后又被调度到第二个cpu上运行，此时在访问数据就会去第一个cpu 的 L1,L2 ,L3 cache上的数据，这种属于远程远端内存访问。

在一个 CPU 核上运行时，应用程序需要记录自身使用的软硬件资源信息（例如栈指针、CPU 核的寄存器值等），我们把这些信息称为运行时信息。同时，应用程序访问最频繁的指令和数据还会被缓存到 L1、L2 缓存上，以便提升执行速度。

但是，在多核 CPU 的场景下，一旦应用程序需要在一个新的 CPU 核上运行，那么，运行时信息就需要重新加载到新的 CPU 核上。而且，新的 CPU 核的 L1、L2 缓存也需要重新加载数据和指令，这会导致程序的运行时间增加。

这个优化点不是一股脑的就去优化，我们仔细检测 Redis 实例运行时的服务器 CPU 的状态指标值，如果redis CPU 的 context switch 次数比较多,就需要优化。

context switch 是指线程的上下文切换，这里的上下文就是线程的运行时信息。在 CPU 多核的环境中，一个线程先在一个 CPU 核上运行，之后又切换到另一个 CPU 核上运行，这时就会发生 context switch。

当 context switch 发生后，Redis 主线程的运行时信息需要被重新加载到另一个 CPU 核上，而且，此时，另一个 CPU 核上的 L1、L2 缓存中，并没有 Redis 实例之前运行时频繁访问的指令和数据，所以，这些指令和数据都需要重新从 L3 缓存，甚至是内存中加载。这个重新加载的过程是需要花费一定时间的。而且，Redis 实例需要等待这个重新加载的过程完成后，才能开始处理请求，所以，这也会导致一些请求的处理时间增加。

在linux 系统下可以用下面命令查看程序的context switch:

cswch 表示自愿的上下文切换，进程运行时由于系统资源不足，如IO,内存等原因不得不进行切换。

nvcswch 表示非自愿的上下文切换，比如时间片用完，系统调度让其他任务运行，或者竞争CPU的时候也会发生。

cswch/s 表示每秒上下文切换次数。

那么怎的绑定呢，可以用 taskset 命令，命令如下：

taskset -c 0 ./redis-server

就把 Redis 实例绑在了 0 号核上，其中，“-c”选项用于设置要绑定的核编号。

我们在《redis 为什么会阻塞》讲过，redis 不仅有对redis 主线程关键路径上的操作，还有子线程aof 重写，生成rdb 操作。主线程和子线程都会资源竞争,在aof 重写等情况下，主线程会被阻塞，为了缓解这么状况，应该把cpu物理核的所有核都绑定上。

我们用lscpu 查看cpu 所有的逻辑核：

lscpu

Architecture: x86_64
...
NUMA node0 CPU(s): 0-5,12-17
NUMA node1 CPU(s): 6-11,18-23
...

上面表示的一个服务器，有两个cpu 分别是node0,node1 。每个cpu 是6个物理核，每个物理核又有两个逻辑核，总共24个逻辑核。它的编号规则是，先编号每个物理核的第一个逻辑核，在编号第二个物理核的所有逻辑核

对于node0 来说 0-5 的意思是：

0 第一个物理核的第一个逻辑核，1 第二个物理核的第一个逻辑核，2 第三个物理核的第一个逻辑核，3 第四个物理核的第一个逻辑核，4 第五个物理核的第一个逻辑核，5 第六个物理核的第一个逻辑核

对于node0 来说 12-17 的意思是：

12 第一个物理核的第二个逻辑核，13 第二个物理核的第二个逻辑核，14 第三个物理核的第二个逻辑核，15 第四个物理核的第二个逻辑核，16 第五个物理核的第二个逻辑核，17 第六个物理核的第二个逻辑核

那么如我我们要绑定cpu 的第一个物理核上，综上所述可以这么写：

taskset -c 0,12 ./redis-server

还可以进一步优化，把子进程和后台线程绑到不同的 CPU 核上。对于Redis 6.0 以上的版本可以通过配置 (redis.conf) ：

io-threads-affinity 1,13   //绑定到第一个cpu第二个物理核上

对于 Redis 6.0 以下可以修改源码，现在大家用的都是高版本，对于修改源码不讲解了，大家用的也不会太多，而且必须对源码有很深的理解。

篇幅比较长下基线性能测试放到下一篇了。

原文地址：https://blog.csdn.net/xingjigongsi/article/details/136520607

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Javaweb之SpringBootWeb案例之自动配置案例的自定义starter测试的详细解析
下一篇：AI最新！雷军、许礼进、曹文泽、屠红燕发声

防火墙----iptables
防火墙会从以上至下的顺序来读取配置的策略规则，在找到匹配项后就立即结束匹配工作并去执行匹配项中定义的行为（即放行或阻止）。如果在读取完所有的策略规则之后没有匹配项，就去执行默认的策略。iptables
阅读更多2024-11-18
Python代码热流系统进行建模分析
从指定的Excel文件中读取与热流相关的数据，包括管径、长度、压力、流量、入口过冷焓等参数。根据读取的数据，利用库计算多种水的物性参数，如饱和焓值、密度、比热容、粘度等。通过一系列复杂的物理公式和迭代
阅读更多2024-11-18
二、vue指令
点击展开或收起时，把内容区域显⽰或者隐藏。v-bind:属性名="vue变量"指代事件对象传给事件处理函数。⽅便通过变量控制⼀套标签出现。修饰符给事件扩展额外功能。修饰符名即可使⽤
阅读更多2024-11-18
信奥学习规划（CSP-J/S)
CSP - J/S（非专业级软件能力认证 - 入门级 / 提高级）的信奥学习规划
阅读更多2024-11-18
ctfshow DSBCTF web部分wp
需要值不同而 md5 相同，有长度限制不能进行强碰撞，尝试数组绕过也不行，这里注意到可以让其类型不同而值相同进行绕过，构造 pop 链最后得到 flag。
阅读更多2024-11-18
【Linux】进程的优先级
cpu资源分配的先后顺序，就是指进程的优先权（priority）。优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用，可以改善系统性能。还可以把进程运行到指定的CP
阅读更多2024-11-18
Linux—进程学习-02
进程相关的概念的学习【利用系统调用fork创建子进程】【利用fork实现多进程】【操作系统层面上进程状态运行、阻塞、挂起的理解和学习】【Linux操作系统具体的进程状态的理解和学习（R、S、T、t、D
阅读更多2024-11-18
HMI FUXA测试
FUXA是基于Web的，过程（SCADA、HMI、看板等）可视化软件。可创建现代的过程可视化，使用独立的设计器，显示机器和实时数据。。
阅读更多2024-11-18
基于Java Springboot城市交通管理系统
城市交通管理系统的目的是让使用者可以更方便的将人、设备和场景更立体的连接在一起。能让用户以更科幻的方式使用产品，体验高科技时代带给人们的方便，同时也能让用户体会到与以往常规产品不同的体验风格。这就意味
阅读更多2024-11-18
pytorch中的ImageFolder 用法
是 PyTorch 中模块提供的一个常用类，用于从文件夹中加载图像数据。它是一种非常方便的方式来加载按文件夹结构组织的图像数据集。这个类能够自动将文件夹中的子目录作为标签，并且将其中的图像文件加载为
阅读更多2024-11-18

redis 性能优化一

前言

尾延迟

相关文章