SQL优化 - 排序

🕗 发布于 2024-10-04 18:08 sql

文章目录

排序和索引
- 降序索引
Filesort
ORDER BY 顺序问题
ORDER BY + LIMIT

排序和索引

如果ORDER BY操作使用了索引，那么就可以避免排序操作，因为索引本身就是按索引 key 排好序的。那什么情况下，ORDER BY会走索引呢？

例如：sakila.rental 表有一个联合索引rental_date(rental_date, inventory_id, customer_id)

在这里插入图片描述
下面来看SELECT * FROM rental ORDER BY rental_date, inventory_id;这条 sql 是否走索引

mysql> EXPLAIN SELECT * FROM rental ORDER BY rental_date, inventory_id;
+----+-------------+--------+------------+------+---------------+------+---------+------+-------+----------+----------------+
| id | select_type | table  | partitions | type | possible_keys | key  | key_len | ref  | rows  | filtered | Extra          |
+----+-------------+--------+------------+------+---------------+------+---------+------+-------+----------+----------------+
|  1 | SIMPLE      | rental | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 16008 |   100.00 | Using filesort |
+----+-------------+--------+------------+------+---------------+------+---------+------+-------+----------+----------------+
1 row in set, 1 warning (0.00 sec)

从执行计划来看是没走索引的，因为使用了SELECT *。在这种情况下，扫描整个索引并查找表行以查找不在索引中的列可能比扫描表并对结果进行排序成本更高，因此优化器可能不会使用索引。如果SELECT *仅选择索引列，也就是使用索引覆盖策略，则可以使用索引来避免排序。例如：

EXPLAIN SELECT inventory_id, rental_date, customer_id 
FROM rental ORDER BY rental_date, inventory_id;

那是不是SELECT *都不走索引？

如果索引不完全包含查询的所有列，需要回表的话，则需要WHERE子句的选择性足以使索引范围扫描比表扫描成本更低，则优化器会选择使用索引。也就是让索引的所有未使用部分和所有额外的ORDER BY列都是WHERE子句中的常量条件。这样即使ORDER BY的列与索引不完全匹配，也可以使用索引。例如：

SELECT * FROM t1 WHERE key_part1 = constant
  ORDER BY key_part2;

降序索引

https://dev.mysql.com/doc/refman/8.0/en/descending-indexes.html
如果索引的排序和ORDER BY的排序不一致，可以考虑使用降序索引

Filesort

如果ORDER BY不满足用索引的条件，MySQL将执行文件排序操作，读取表的行并对其进行排序。

从MySQL 8.0.12开始，优化器会根据需要增量地分配内存缓冲区（叫做 Sort Buffer），直到超过sort_buffer_size的大小，而MySQL 8.0.12之前，是直接预先分配固定数量的sort_buffer-size字节大小的内存缓冲区。将sort_buffer_size设置为更大的值来加速更大的排序。增量分配的这种方式可以在小排序发生时不会占用过多的内存。

如果结果集太大（超过sort_buffer_size）而无法放入内存，文件排序操作会根据需要使用临时磁盘文件，这种情况性能就比较差了

mysql> EXPLAIN SELECT * FROM rental ORDER BY inventory_id;
+----+-------------+--------+------------+------+---------------+------+---------+------+-------+----------+----------------+
| id | select_type | table  | partitions | type | possible_keys | key  | key_len | ref  | rows  | filtered | Extra          |
+----+-------------+--------+------------+------+---------------+------+---------+------+-------+----------+----------------+
|  1 | SIMPLE      | rental | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 16008 |   100.00 | Using filesort |
+----+-------------+--------+------------+------+---------------+------+---------+------+-------+----------+----------------+
1 row in set, 1 warning (0.00 sec)

ORDER BY 顺序问题

如果order by列有相同的值，那么MySQL可以自由地以任何顺序返回这些行。换言之，只要order by列的值不重复，就可以保证返回的顺序。可以在order by子句中包含附加列，以使顺序具有确定性。为了保证每次都返回的顺序一致可以额外增加一个排序字段（比如：id），用两个字段来尽可能减少重复的概率

MySQL具体的排序策略受以下几个因素影响：

是否可用的索引
预期结果大小
MySQL版本

一般来说，排序处理过程如下

读取与WHERE子句匹配的行
对于每一行，记录一个由排序 key 和行位置组成的值元组，以及查询所需的列
按排序 key 的值对元组进行排序
按排序好的顺序根据行未知检索行，但直接从排序的元组中读取所需的列，而不是第二次访问表

ORDER BY + LIMIT

对于order by查询，带或者不带limit可能返回行的顺序是不一样的。

如果limit row_count 与 order by 一起使用，那么在找到第一个row_count就停止排序，直接返回。

例如平时开发常见的分页查询

SELECT * FROM rental ORDER BY inventory_id LIMIT 1, 10

会导致多页出现同一条数据
在这里插入图片描述
如果想在limit存在或不存在的情况下，都保证排序结果相同，可以额外加一个排序条件。例如id字段是唯一的，可以考虑在排序字段中额外加个id排序去确保顺序稳定。这样分页的问题就解决了。

SELECT * FROM rental ORDER BY rental_id, inventory_id LIMIT 1, 10

原文地址：https://blog.csdn.net/qq_40926260/article/details/142702707

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【洛谷】AT_dp_m Candies 的题解
下一篇：使用 K-Means 进行客户分群分析

Redis-主从复制
redis主从复制
阅读更多2024-10-07
js快速转换时间（时间戳转换成年月日时分秒）
1728270833000 转换为 2024-10-07 11:13:53。1728270833000 转换为 2024/10/07 11:13:53。
阅读更多2024-10-07
C++之模版进阶篇
在模版初阶我们学习了函数模版和类模版的相关知识，对模版有了一定的了解，接下来我们将对模版进行进一步的了解，话不多说，直接上货！！！本节内容1.非类型模板参数2.类模板的特化3.模板的分离编译。
阅读更多2024-10-07
CSS盒子模型
作用：布局网页，摆放盒子和内容。
阅读更多2024-10-07
《Web3 安全：攻击与防御全景指南》
Web3 的出现代表了互联网从中心化向去中心化的过渡，这不仅仅是技术上的升级，更是对现有互联网模式的深刻变革。这一阶段的标志是用户生成内容的爆发、平台经济的兴起，以及互联网巨头的垄断地位。以太坊等区块
阅读更多2024-10-07
[图形学]smallpt代码详解（2）
本文紧接在[[图形学]smallpt代码详解（1）](https://blog.csdn.net/Strengthennn/article/details/142700299)之后，继续详细讲解**s
阅读更多2024-10-07
2024年了，Java程序员面试背八股还有用吗？
今年已经过去大半，但还是有很多Java程序员没有找到工作或者成功跳槽，跳槽成功的也只是从一个坑中，跳入另一个坑中……
阅读更多2024-10-07
打工人狂喜，轻松定时发圈
3、选择你想要定时发圈的微信号和具体的发布时间。还可以选择循环发送，这样一来，周末或节假日的时候你就可以放心地出去玩，完全不需要担心发圈的事情了！2、打开发圈功能，编辑好发圈的内容和图片，还可以根据需
阅读更多2024-10-07
基于springboot和vue.js 养老院管理系统设计与实现
本次程序开发选用的数据库管理工具是Mysql数据管理工具，使用它存放数据也需要创建程序对应的数据库文件，并命名刚创建的数据库文件，有了数据库也需要创建各种数据表来充实数据库，在数据表的创建中，不仅需要
阅读更多2024-10-07
CSP-S复赛真题解析
【代码】CSP-S复赛真题解析。
阅读更多2024-10-07