高级java每日一道面试题-2024年9月29日-数据库篇-索引怎么定义,分哪几种?

🕗 发布于 2024-09-29 23:22 数据库 java 索引分类 数据结构

如果有遗漏,评论区告诉我进行补充

面试官: 索引怎么定义,分哪几种?

我回答:

在Java高级面试中，尤其是涉及数据库和数据结构的部分，索引（Index）是一个核心概念。索引的目的是提高数据库表中数据的检索速度，从而加快数据库查询、更新等操作的执行效率，特别是在处理大量数据时。不过，需要明确的是，索引通常是在数据库层面定义的，而不是直接在Java代码中定义（Java代码主要通过SQL语句来操作数据库，包括创建和管理索引）。但理解索引的原理和类型对于任何使用数据库的Java开发者都是非常重要的。

索引的定义

索引是一种数据结构，在数据库中用于帮助快速找到表中某一行的辅助数据结构。索引可以建立在数据库表的一列或多列上，它是数据库管理系统自动创建的表之外的隐藏对象。使用索引后，数据库系统不必扫描整个表，就能迅速定位到某条记录的位置。

索引的分类

索引可以根据不同的标准进行分类，主要包括以下几种：

按基本功能分类：

单列索引：只包含表中一个字段的索引。
复合索引（或多列索引）：包含表中两个或两个以上字段的索引。创建复合索引时，会考虑索引中列的顺序。
唯一索引：保证索引列的值唯一的索引。在唯一索引中，表中任意两行在索引列上的值都不能相同。
主键索引：是表中的一列或多列的组合，其值能唯一地标识表中的每一行。实际上，主键索引就是一种特殊的唯一索引，且不允许有NULL值。

按字段数量分类

单列索引：仅包含一个列的索引。
复合索引（也称组合索引或多列索引）：包含多个列的索引。复合索引的列顺序非常重要，因为它会影响查询性能。

按唯一性分类

唯一索引：确保索引列中的所有值都是唯一的。
非唯一索引：允许索引列中有重复的值。

按物理存储方式分类：

B-Tree索引：最常用的索引类型之一，适用于范围查询和排序。
Hash索引：基于哈希函数的索引，适用于等值查询。
Bitmap索引：使用位图表示数据的存在性，适用于低基数列（即列中唯一值较少的情况）。
R-Tree索引：适用于多维空间数据，如地理信息系统（GIS）。
全文索引：主要用于搜索文本中的关键字，而不是直接比较索引中的值。

按逻辑角度分类

聚集索引（Clustered Index）：在关系型数据库中，聚集索引决定了数据行的物理存储顺序。每个表只能有一个聚集索引。
非聚集索引（Non-Clustered Index）：不改变数据行的物理存储顺序，而是创建一个单独的数据结构来加速查询。每个表可以有多个非聚集索引。

按存储方式分类

内存索引：索引数据完全存储在内存中，适用于高速读取。
磁盘索引：索引数据存储在磁盘上，适用于大规模数据集。

详解

B-Tree索引

特点：
- 平衡树结构，所有叶子节点在同一层。
- 支持范围查询和排序。
- 插入、删除和查找操作的时间复杂度为O(log n)。
适用场景：
- 范围查询（如 WHERE column BETWEEN ... AND ...）。
- 排序查询（如 ORDER BY column）。

Hash索引

特点：
- 基于哈希函数计算键值的位置。
- 查找速度快，平均时间复杂度为O(1)。
- 不支持范围查询和排序。
适用场景：
- 等值查询（如 WHERE column = 'value'）。

Bitmap索引

特点：
- 使用位图表示数据的存在性。
- 非常适合低基数列（如性别、状态等）。
- 占用空间小，查询速度快。
适用场景：
- 低基数列的查询。

R-Tree索引

特点：
- 适用于多维空间数据。
- 用于地理信息系统（GIS）中的空间查询。
适用场景：
- 多维空间数据查询（如地图应用中的点、线、面查询）。

复合索引

特点：
- 包含多个列的索引。
- 列的顺序非常重要，前导列的选择会影响查询性能。
适用场景：
- 经常需要同时查询多个列的情况。

唯一索引

特点：
- 确保索引列中的所有值都是唯一的。
- 可以作为主键的一部分。
适用场景：
- 需要保证列值唯一性的场景。

聚集索引与非聚集索引

聚集索引：
- 决定了数据行的物理存储顺序。
- 每个表只能有一个聚集索引。
非聚集索引：
- 不改变数据行的物理存储顺序。
- 创建一个单独的数据结构来加速查询。
- 每个表可以有多个非聚集索引。

示例

假设我们有一个 employees 表，包含以下列：id, name, department_id, salary。

CREATE TABLE employees (
    id INT PRIMARY KEY,
    name VARCHAR(100),
    department_id INT,
    salary DECIMAL(10, 2)
);

创建索引

单列索引：

CREATE INDEX idx_name ON employees(name);

复合索引：

CREATE INDEX idx_department_salary ON employees(department_id, salary);

唯一索引：

CREATE UNIQUE INDEX uidx_email ON employees(email);

聚集索引：
在MySQL中，主键默认是聚集索引。
```
ALTER TABLE employees ADD PRIMARY KEY (id);
```

非聚集索引：

CREATE INDEX idx_salary ON employees(salary);

注意

索引虽然能加速数据检索，但也会消耗额外的磁盘空间，并降低写操作的性能（因为插入、删除和更新操作时需要同时修改表和索引）。
在设计索引时，需要综合考虑数据的查询频率、修改频率、空间使用、数据分布等因素。

总结

索引是提高数据库查询性能的重要工具。根据不同的需求和场景选择合适的索引类型至关重要。在设计索引时，需要考虑以下几点：

数据量大小
查询模式（范围查询、等值查询等）
更新频率
存储空间

通过合理地设计和使用索引，可以显著提高应用程序的性能。

原文地址：https://blog.csdn.net/qq_43071699/article/details/142643122

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Latex 自定义运算符加限定条件的实现
下一篇：MySQL基础篇 - 函数

MySQL数据库基础
在过去的mysql中主要是使用的utf8mb3，但是mysql显示的就是utf8，中mysql8中区分显示了。类似于不同的编译器，虽然C/C++的代码是一样的，但是预处理、编译、汇编、链接这些过程却不
阅读更多2024-09-30
Percona Monitoring and Management
Percona Monitoring and Management (PMM)是一款开源的专用于管理和监控MySQL、MongoDB、PostgreSQL。
阅读更多2024-09-30
鸿蒙开发（NEXT/API 12）【已连接穿戴设备查询】手机侧应用开发
Wear Engine提供查询用户已连接的穿戴设备列表（即支持Wear Engine能力且与手机侧运动健康App处于连接状态的穿戴设备）的接口。
阅读更多2024-09-30
Redis数据库
本篇文章介绍了redis的相关知识，并使用springboot集成redis，实现缓存和分布式锁，后续会对文章勘误及更新~~
阅读更多2024-09-30
旧版的存档
【代码】旧版的存档。
阅读更多2024-09-30
Spring Boot 封装统一返回结果及全局异常处理
为了更细致地控制异常处理，我们可以定义一些自定义异常。然后，在全局异常处理器中添加对自定义异常的处理。通过封装统一的返回结果和全局异常处理，我们可以让Spring Boot应用更加健壮和易于维护。这种
阅读更多2024-09-30
【C++】IO流
C++IO流，包含输入输出流、文件流、字符流
阅读更多2024-09-30
低至1元/小时：国庆七天，30元通关《黑神话：悟空》！
随着《黑神话：悟空》自8月20日全球同步上线，正式登陆PC、PS5平台以来，以其精湛的画面和流畅的战斗体验，在发售三天后，该作的全平台销量超过1000万套，打破中国游戏历史记录，被媒体称为“中国首款3
阅读更多2024-09-30
阿里巴巴国际站获取商品详情item_get接口技术分享
item_get API接口是阿里巴巴开放平台提供的一个重要接口，它允许商家通过API调用，获取阿里巴巴平台上的商品详细信息。这些信息包括商品标题、价格、库存、属性、描述等，为商家提供了全面、准确的商
阅读更多2024-09-30
软件测试谣言二三事，认真你就输了
软件测试的职业寿命，取决于互联网行业能存活多久，至少目前看来，这个职业没有消失的风险，至于你能在这个职业待多久，那取决于你自己的能力，我见过不少超过35岁的老员工还在测试的职位上兢兢业业。以广州为例，
阅读更多2024-09-30