【数据库】MySQL架构探秘——select语句与update语句的执行流程

🕗 发布于 2025-01-22 10:01 数据库 mysql 架构

1.select语句的执行流程

1.1.连接层

1.2.缓存层

1.select语句的执行流程

1.1.连接层

当MySQL服务器启动（MySQL服务器就是一个进程），等待客户端连接，对于每一个客户的连接请求，服务器都会创建一个新的新的线程处理（如果是线程池的话，则是分配一个空的线程），每个线程都是独立的，拥有各自的内存处理空间

使用客户端访问MySQL数据，第一步是连接上MySQL的服务器

协议问题

连接所使用的协议大多数是TCP协议，也可以使用其他的协议，例如：Unix的Socket

连接问题

连接可以是长连接也可以是短连接，短连接的特点是连接后立即关闭，比较消耗资源。长连接使用后不会立即释放，可以给其他的客户端继续使用，所以MySQL大多数都是使用的长连接

同步问题

MySQL支持同步和异步的方式，大多数使用的是同步的方式，异步会给编程带来复杂性

通过命令查看MySQL服务器端连接相关的默认配置

SHOW GLOBAL STATUS LIKE 'Thread%';

连接在指定超时的时间后，会更新销毁

非交互式超时时间，如JDBC程序方式连接

SHOW GLOBAL VARIABLES LIKE 'wait_timeout';

交互式超时时间，如客户端工具

SHOW GLOBAL VARIABLES LIKE 'interaction_timeout';

交互式与非交互式的区别：

交互式：用户通过命令行客户端或图形界面工具直接与MySQL数据库进行交互的连接，如直接进行SQL查询

非交互式：程序与MySQL数据库之间的连接，通常用于批处理、自动化任务、定时任务

MySQL数据库默认支持的并发连接数量是151，是可以修改的

显示默认的最大并发连接数

SHOW VARIABLES LIKE 'max_connections';

注意：

加了Global的命令是查看全局的参数，没有加是查看当前会话级别的参数。如果想设置为全局的，Linux系统下修改/etc/my.cnf配置文件，Windows下修改my.ini配置文件

1.2.缓存层

MySQL数据库中支持缓存，在5.7的版本中默认是关闭状态，在8.0的版本中去掉了MySQL的缓存

查询MySQL缓存

SHOW VARIABLES LIKE 'query_cache%';

在MySQL的配置文件my.ini中也可以找到缓存相关的配置，默认是关闭的，即query_cache_size=0

以上信息是默认配置，MySQL的查询缓存用于缓存SELECT查询结果，在下一次接收到相同的的查询请求时，系统会直接返回缓存结果，而不执行实际查询处理。这种查询缓存能够提高查询速度，优化查询性能，前提是存在大量相同或相似的查询且表数据变化较少。若 SQL 语句有任何更改（例如，修改一个空格），之前的缓存将失效。此外，表中完成的新增或修改操作也会导致缓存失效。

如果想要使用缓存，我们要进行配置：

将query_cache_size设置为具体的大小，具体大小是多少取决于查询的实际情况，但最好设置为1024的倍数
增加一行query_cache_type=1。query_cache_type参数用于控制缓存的类型，注意这个值不能随便设置，必须设置为数字。说明如下：

设置为0，禁用了缓存
设置为1，将会缓存所有的结果，除非SELECT语句使用SQL_NO_CACHE禁用了查询缓存
设置为2，则只会缓存那些在SELECT语句中通过SQL_CACHE指定需要缓存的查询

1.3.解析层

解析器解析编写的sql语句，根据关键字运算符等生成对应的树形结构

词法和语法解析：解析sql语句，生成树形结构

语义解析：判断表名或者字段是否存在、使用的别名是否正确

例如：

SELECT * FROM xxx;

xxx表如果不存在，sql语句会报错

1.4.优化器

编写了一条sql语句，它是有多种执行路径的，只不过最终的执行结果是相同的。多种路径是由哪个组件来生成的，最终选择哪一个路径来执行该sql呢

MySQL架构中使用优化器来根据解析树生成多条执行路径（执行计划），最终会选择一个执行计划去执行

执行计划生成后，通过评估每条路径的成本选择其中最优执行计划进行执行

优化器还会对sql语句进行优化，例如，在进行多表查询（如JOIN）时，优化器会优化查询顺序，决定先查询哪张表、后查询哪张表。当一条sql语句可以使用多个索引时，优化器会选择成本最低的索引。此外，对于类似1=1这样的冗余条件，优化器也会自动去除，以提高执行效率

加入explain以查看优化器生成的执行计划

EXPLAIN SELECT * FROM user;

如果想查看更详细的信息，可以显示JSON的数据格式

EXPLAIN FORMAT=JSON SELECT * FROM user;

1.5.执行器与存储引擎

存储引擎在MySQL的逻辑架构中位于第三层，负责MySQL中数据的存储和提取。MySQL存储引擎有很多，不同的存储引擎保存数据和索引的方式是不同的

查看所有存储引擎

SHOW ENGINES;

有的时候需要快速查询且不需要持久化，对于基于内存的操作，可以使用Memory引擎

对于历史数据，几乎没有新增和查询需求且需要数据压缩时，可以使用Archive引擎

在需要大量读写并发操作和数据一致性的场景下，可以使用InnoDB引擎

1.6.MySQL架构总结

执行SQL语句的流程

MySQL的系统架构图

2.update语句的执行流程

2.1.buffer pool缓冲区

update语句的整体执行流程和select语句是一样的

MySQL想完成数据的修改，会先从存储引擎层读取数据，把数据读取到服务层进行数据的修改，再通过存储引擎层把数据更新到数据库中

MySQL每次读取数据都会读取16384个字节的数据，默认是16KB的数据，也就是一页的数据

在InnoDB引擎中设计了buffer pool缓冲区。MySQL从磁盘中通过IO读取数据到buffer pool中，引擎从buffer pool中获取数据，然后修改，再把数据写入到buffer pool中，从而完成读写的操作。因为是基于内存的操作，所以速度是非常快的

在buffer pool中还没有同步到磁盘中的数据称为脏数据

InnoDB的脏页刷新机制：

当InnoDB中的脏页比例超过innodb_max_dirty_pages_pct_lwm的值时，InnoDB就会开始刷新脏页到磁盘
当InnoDB中的脏页比例不仅超过innodb_max_dirty_pages_pct_lwm的值，而且还超过innodb_max_dirty_pages_pct时InnoDB就会进入勤快刷新模式(agressively flush），这个模式下InnoDB会把脏页更快的刷新到磁盘
还有一种情况叫做sharp checkpoint ,当InnoDB要重用它之前的redo文件时，就会把innodb_buffer_pool中所有与这个文件有关的页面都要刷新到磁盘；这样做就有可能引起磁盘的IO风暴了，轻者影响性能，重者影响可用性

对于控制刷新机制的各个参数的说明：

innodb_max_dirty_pages_pct默认值为75，也就是说当脏页比例超过75%时才会进入勤快刷新模式
innodb_max_dirty_pages_pct_lwm默认值是0，0是一个特殊值，它表示不启用这个功能；由于没有启用这个功能，也就是说innodb_buffer_pool中的脏页比例会操持在75%左右

MySQL会在后台使用若干线程，负责把buffer pool中的数据刷新到磁盘中去。常用到的线程有：

master thread：主线程

IO thread：IO操作的线程

Purge thread：清理数据和日志的线程

Page Cleaner thread：刷脏的线程

查看与脏页相关的配置

SHOW VARIABLES LIKE '%dirty_page%';

查看buffer pool的大小，默认是128M

SHOW VARIABLES LIKE '%innodb_buffer_pool%';

数据存储到buffer pool中，默认是128M，如果buffer pool存满了，那么innodb引擎会使用改良的LRU算法清理数据

官方文档地址：

MySQL :: MySQL 5.7 Reference Manual :: 14.5.1 Buffer Pool

2.2.redo log日志

InnoDB引擎把数据存入到buffer pool中，如果还没来得及把数据刷新到磁盘上，这个时候数据库的服务挂掉了，那么数据就丢失。为了解决这个问题，MySQL设计了redo log日志进行备份，它是基于磁盘的方式存储的

随机磁盘IO和顺序磁盘IO的区别

使用随机磁盘IO会将数据分散到不同的扇区存储，因为它的底层是通过索引顺序来存储，索引会存储到不同的扇区。那么更新数据的时候会增加寻道的时间，写入数据会变慢。

顺序磁盘IO是按着顺序追加写入的

通过命令查看innodb_log相关的信息

SHOW VARIABLES LIKE '%innodb_log%';

日志存储的文件路径是 .\ 表示当前数据目录下，打开文件夹查看

innodb_log_files_in_group的值默认为2，所以产生2个日志文件

每个文件的大小默认是48M（可以修改），数据满了会产生覆盖的效果

站在MySQL事务的角度，redo log日志是事务持久性的保证

log buffer刷盘机制

log buffer刷盘时间间隔

每隔一秒刷盘一次，具体的刷盘策略由innodb_flush_log_at_trx_commit参数来决定

innodb_flush_log_at_trx_commit：用来控制redo log刷新到磁盘的策略

当设置为1的时候，事务每次提交都会将log buffer中的日志写入os buffer并调用fsync()刷到log file on disk中。这种方式即使系统崩溃也不会丢失任何数据，但是因为每次提交都写入磁盘，IO的性能较差

当设置为0的时候，事务提交时不会将log buffer中日志写入到os buffer，而是每秒写入os buffer并调用fsync()写入到log file on disk中。也就是说设置为0时是每秒都会刷新且写入到磁盘中，当系统崩溃，会丢失1秒钟的数据

当设置为2的时候（默认为2），每次提交都仅写入到os buffer，然后是每秒调用fsync()将os buffer中的日志写入到log file on disk

2.3.undo log日志

undo log可以称为撤销日志或者回滚日志，站在事务的角度，undo log可以保证事务的原子性

日志中记录的反向操作，例如：把username=”张三” 修改成了username=”赵四”，那么undo log中记录的是原来的值，即username=”张三” 这样数据库再发生回滚操作的时候，可以把数据恢复回来

SHOW VARIABLES LIKE '%undo%';

在本地存储的位置：

MySQL的InnoDB存储引擎架构图

2.4.bin log日志

binary log即二进制日志，属于mysql服务层的日志，它是记录所有数据库表结构变更（例如CREATE、ALTER TABLE…）以及表数据修改（INSERT、UPDATE、DELETE…）的二进制日志，它的主要作用是主从复制和进行数据恢复

bin log不会记录SELECT和SHOW这类操作，因为这类操作对数据本身并没有修改，但我们可以通过查询通用日志来查看MySQL执行过的所有语句

特点：

记录DDL和DML的语句，属于逻辑日志
没有固定大小限制，内容可以追加
Server层实现，可以被所有存储引擎使用

SHOW GLOBAL VARIABLES LIKE '%log_bin%';

bin log主从复制的原理流程图

2.5.总结update语句执行流程

原文地址：https://blog.csdn.net/2302_78914800/article/details/145289049

免责声明：本站文章内容转载自网络资源，如侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：基于Python django的音乐用户偏好分析及可视化系统设计与实现
下一篇：Java学习，List截取

【优选算法】3----快乐数
这是第三篇算法题，也是十分的不好想，虽然定位在简单，但我感觉还是有些难度的~
阅读更多2025-01-22
算法竞赛之差分进阶——等差数列差分 python
给定区间 [ l, r ]，把数组[ l, r ] 区间中的数加上一个首项s、末项e、公差为d的等差数列如何实现？
阅读更多2025-01-22
Linux:进程控制
• 另外，进程⼀旦变成僵⼫状态，那就⼑枪不⼊，“杀⼈不眨眼”的kill -9 也⽆能为⼒，因为谁也没有办法杀死⼀个已经死去的进程。通常，⽗⼦代码共享，⽗⼦再不写⼊时，数据也是共享的，当任意⼀⽅试图写⼊
阅读更多2025-01-22
2024：CSDN上的收获与蜕变——我的技术成长之旅
2024：CSDN上的收获与蜕变——我的技术成长之旅
阅读更多2025-01-22
【C】memory 详解
【C】memory详解
阅读更多2025-01-22
OpenMP并行编程实例系列3 —— 线程设置
等待同步：用在并行域内，所有线程执行到 barrier 都要停下等待，直到所有线程都执行到 barrier，然后再继续往下执行。指定并行域中的串行任务，创建仅由一个线程执行的任务，先到先执行，其他线程
阅读更多2025-01-22
【GitHub】登录时的2FA验证
如何进行2FA认证，以及验证后如何在新设备或新浏览器登录
阅读更多2025-01-22
【Python项目】小区监控图像拼接系统
科技的介入正在重塑我们的生活方式，而越来越多的人也开始享受这种由科技带来的便利和变化。例如，监控画面分散，安保人员需要在多个屏幕上查看不同的区域，这不仅增加了管理难度，也降低了监控效率。该系统利用先进
阅读更多2025-01-22
Mysql触发器（学习自用）
仅供学习使用，如有错误，欢迎指正。
阅读更多2025-01-22
堆的实现（C语言详解版）
（Heap）是一种特殊的完全二叉树，它满足父节点的值总是不大于或不小于其子节点的值。这种数据结构常用于实现优先队列，以及在各种排序算法中快速找到最大或最小元素。和。在最大堆中，父节点的值总是大于或等于
阅读更多2025-01-22

【数据库】MySQL架构探秘——select语句与update语句的执行流程

1.select语句的执行流程

1.1.连接层

1.2.缓存层

1.3.解析层

1.4.优化器

1.5.执行器与存储引擎

1.6.MySQL架构总结

2.update语句的执行流程

2.1.buffer pool缓冲区

2.2.redo log日志

2.3.undo log日志

2.4.bin log日志

2.5.总结update语句执行流程

相关文章