【Mysql】索引相关基础知识（一）

🕗 发布于 2024-12-13 15:29 mysql 数据库 后端 java

文章目录

❓索引是什么？

索引类似于书本的目录，可以帮助你快速定位到目标内容。在关系数据库中，索引是一种数据结构，用于将数据按照一定的规则排序，从而加速数据的查找和访问。

特点：

通过索引，可以快速找到目标数据，而无需全表扫描。
索引的本质是以增加存储开销和维护成本为代价来换取查询性能的提升，体现了典型的“以空间换时间”的思想。

索引的分类

根据不同的维度，索引可以分为以下几类：

1. 按数据结构分类

B+树索引：常见的默认索引结构，适用于范围查询。
Hash索引：基于哈希表实现，适合等值查询，但不支持范围查询。
全文索引（Full-text）：用于对大段文本进行全文搜索。

2. 按物理存储分类

聚集索引（Clustered Index）：数据和索引存储在一起，表数据按照索引排序，主键索引通常为聚集索引。
非聚集索引（Non-clustered Index）：索引和数据分开存储，索引指向实际的数据位置。

3. 按字段特性分类

主键索引（PRIMARY KEY）：表中唯一的标识，默认创建聚集索引。
唯一索引（UNIQUE）：保证索引列的值唯一，可以有多个。
普通索引（INDEX）：最常见的索引类型，没有任何约束。
全文索引（FULLTEXT）：用于搜索文本内容。

4. 按字段个数分类

单列索引：索引仅包含一个字段。
联合索引（复合索引/组合索引）：索引包含多个字段，查询时遵循“最左前缀”原则。

“最左前缀”原则： A->B，你要先追踪A，才能追踪到B

常见的索引数据结构

1. 二叉树

特点：每个节点最多有两个子节,大在右，小在左。数据随机性情况下树杈越明显。
缺点：容易退化为链表，导致性能下降。

时间复杂度正常为O(logn)
在这里插入图片描述

但是如果结点按照顺序进入，树的高度则会很高（就是一个链表结构），此时元素的查找效率就等于链表查询O(n)，数据检索效率将极为低下。在这里插入图片描述

2. 红黑树

红黑树说白了就是平衡二叉树，动态变化防止出现链表结构。所以查找、插入和删除操作时间复杂度一直是O(logn)

特点：一种自平衡二叉搜索树，插入和删除时性能稳定。
缺点：树的高度较高时，磁盘 I/O 次数增加，性能不佳。

在这里插入图片描述

数据库索引中，二叉树及其变种的使用有限，更多的是使用**多叉树（如 B 树和 B+ 树）**来组织数据。

3. B树

B树的出现可以解决树高度的问题。之所以是B树，而不是"xxx二叉树"，就是它不再限制一个父节点中只能有两个子节点，而是允许 M 个子节点（M > 2）。

同时，B树的一个节点可以存储多个元素

特点：多路平衡查找树，每个节点可以包含多个子节点，适合磁盘存储。
缺点：叶子节点之间不相连，范围查询效率稍逊。

绿色模块为具体数据，红色类似于指针。

在这里插入图片描述

4. B+树

B+tree 是在B树基础上的一种优化，其更适合做存储索引结构。在 B+tree 中，非叶子节点上仅存储键值，不存储数据；而所有数据记录均存储在叶子节点上，并且数据是按照顺序排列的。此外在 B+tree 中各个数据页之间是通过双向链表连接的。

在这里插入图片描述

特点：
- B树的改进版本。
- 所有数据存储在叶子节点，内节点仅存储索引。
- 叶子节点通过链表相连，适合范围查询和磁盘存储。
优势：磁盘 I/O 次数少，查询性能更高。

注意：
树的高度对性能有直接影响——树的高度越低，查找效率越高。因此，数据库系统通常会设计索引树的高度为3到4层。

小结

索引的引入能显著提升数据查询效率，但也需要权衡利弊：

优点：加速查询、提升性能。
缺点：增加存储开销，插入、更新、删除操作的维护成本较高。

在实际使用中，合理选择索引类型和数据结构是优化数据库性能的关键。

思考

1. 红黑树的底层原理？
2. B+树的底层原理
3. 为什么 MySQL 选择 B+树作为默认索引的数据结构？

原文地址：https://blog.csdn.net/m0_70871140/article/details/144359927

免责声明：本站文章内容转载自网络资源，如侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：E: 无法获取 dpkg 前端锁 (/var/lib/dpkg/lock-frontend)，是否有其他进程正占用它？
下一篇：牛客周赛71（字符串，状压dp）

构建沉浸式汉语学习环境
系统通过API网关与现有教育平台（如Moodle）无缝集成，支持快速部署。持续学习机制确保内容与时俱进，每月自动更新流行语库与文化热点。的技术三角，构建沉浸式汉语学习环境。
阅读更多2025-01-22
弹框上传预览
【代码】弹框上传预览。
阅读更多2025-01-22
Python 字符串处理深度解析：高级操作技巧、性能优化与实用案例全解
在Python中，字符串（str）是用于表示文本数据的不可变序列类型。其定义方式灵活多样，既可以使用单引号'...'、双引号"..."也可借助三引号'''...'''或"
阅读更多2025-01-22
SELF-RAG: 通过自我反思学习检索、生成和批判——图文并茂总结
SELF-RAG 是一种创新的框架，通过按需检索和自我反思来提高 LLM 的生成质量和事实准确性。实验结果表明，SELF-RAG 在多个任务上均优于现有的 LLM 和 RAG 方法。SELF-RAG
阅读更多2025-01-22
【Nginx系列】Nginx配置超时时间
检查配置是否在正确的上下文中设置。确保没有其他与超时相关的指令冲突。确保每次修改后重载配置，并测试是否正确。检查错误日志了解更多超时信息。尝试这些步骤后，如果仍然无法生效，可以分享更详细的配置或错误日
阅读更多2025-01-22
机器学习-核函数（Kernel Function）
核函数（Kernel Function）是一种数学函数，主要用于将数据映射到一个更高维的特征空间，以便于在这个新特征空间中更容易找到数据的结构或模式。核函数的主要作用是在不需要显式计算高维特征空间的情
阅读更多2025-01-22
Android系统开发（二十）：字体活起来，安卓自定义字体改造指南
在安卓系统中，字体不仅是UI设计的基础，更是品牌和文化的延伸。过去，修改字体需要通过复杂的系统更新，甚至涉及底层操作，风险和成本极高。再到Android 15，可变字体支持和动态实例化技术大大提升了字
阅读更多2025-01-22
【力扣系列题目】不同路径组合总和最大连续1个数打家劫舍{持续更新中...}
【代码】【力扣系列题目】不同路径组合总和最大连续1个数打家劫舍{持续更新中...}
阅读更多2025-01-22
【专题】为2025制定可付诸实践的IT战略规划报告汇总PDF洞察（附原数据表）
在当今瞬息万变的商业环境中，制定有效的IT战略规划对于企业的成功与可持续发展至关重要。本报告深入探讨了制定IT战略规划的关键活动，旨在为企业和决策者提供全面且实用的指导。Gartner的《为2025制
阅读更多2025-01-22
stm32使用MDK5.35时遇到*** TOOLS.INI: TOOLCHAIN NOT INSTALLED
mdk5.35出现***TOOLS.INI:TOOLCHAINNOTINSTALLED的问题！以管理员身份重新打开MDK5.35.0.0，用keygen破解密码，但是一直提示我是没有破解成功。targ
阅读更多2025-01-22

【Mysql】索引相关基础知识（一）

文章目录

❓索引是什么？

索引的分类

1. 按数据结构分类

2. 按物理存储分类

3. 按字段特性分类

4. 按字段个数分类

常见的索引数据结构

1. 二叉树

2. 红黑树

3. B树

4. B+树

小结

思考

相关文章