MySQL索引、事物与存储引擎
目录
一、MySQL索引
1.索引的概念
- 索引是一个排序的列表,在这个列表重存储着索引的值和包含这个值的数据所在行的物理地址(类似于C语言的链接表通过指针向数据记录的内存地址)。
- 使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到改行数据对应的物理地址然后访问相应的数据,因此能加快数据库的查询速度。
- 索引就好比是一本书的目录,可以根据目录中的页码快速找到所需的内容。
- 索引是表中一列或者若干列值排序的方法。
- 建立索引的目的是加快对表中举例的查找或排序。
2.索引的作用
- 设置了合适的索引之后,数据库利用各种快速定位技术,能够大大加快查询速度,这是创建索引的最主要的原因。
- 当表很大或查询涉及到多个表时,使用索引可以成千上万倍地提高查询速度。
- 可以降低数据库的IO成本,并且索引还可以降低数据的排序成本。
- 通过创建唯一键索引,可以保证数据表中的每一行数据的唯一性。
- 可以加快表与表之间的连接。
- 在使用分组和排序时,可大大减少分组和排序的时间。
- 建立索引在搜索和恢复数据库中的数据时能显著提高性能。
索引的副作用:
- 索引需要占用额外的磁盘空间。
- 对于MyISAM引擎而言,索引文件和数据文件是分离的,索引文件用于保存数据记录的地址
而InnoDB引擎的表数据文件本身就是索引文件。 - 更新一个包含索引的表需要比更新一个没有索引的表花费更多的时间,这是由于索引本身也需要更新。因此,理想的做法是仅仅在尝尝被搜索的列(以及表)上面创建索引。
3.创建索引的原则依据
索引虽然可以提升数据库查询的速度,但并不是任何情况下都适合创建索引。因为索引本身会消耗系统资源呢,在有索引的情况下,数据会先进行索引查询,然后定位到具体的数据行,如果索引使用不当,反而会增加数据库的负担。
- 表的主键、外键必须有索引。因为主键具有唯一性,外键关联的是表的主键,查询时可以快速定位。
- 记录超过300行的表应有索引。如果没有索引,每次查询都需要把表遍历一遍,会严重影响数据库的性能。
- 经常与其他表进行连接的表,在连接字段上应该建立索引。
- 唯一性太差的字段不适合建立索引。
- 更新太频繁的字段不适合创建索引。
- 经常出现在where子句中的字段,特别是大表的字段,应该建立索引。
- 在经常进行GROUP BY、ORDER BY的字段上建立索引。
- 索引应该建立在选择性高的字段上。
- 索引应该建立在小字段上,对于打的文本字段甚至超长字段,不要建立索引。
4.索引的分类和创建
create table member (id int(10),name varchar(10),cardid int(18),phone int(11),address varchar(50),remark text);
4.1 普通索引
最基本的索引类型,没有唯一性之类的限制。
- 直接创建索引:
CREATE INDEX 索引名 ON 表名 (列名[(length)]);
#(列名(length)):length是可选项,下同。如果忽略 length 的值,则使用整个列的值作为索引。如果指定,使用列的前 length 个字符来创建索引,这样有利于减小索引文件的大小。在不损失精确性的情况下,长度越短越好。
#索引名建议以“_index”结尾。
create index name_index on member (name);
- 修改表方式创建:
ALTER TABLE 表名 ADD INDEX 索引名 (列名);
- 创建表的时候指定索引:
CREATE TABLE 表名 ( 字段1 数据类型,字段2 数据类型[,...],INDEX 索引名 (列名));
4.2 唯一索引
与普通索引类似,但区别是唯一索引列的每个值都唯一。唯一索引允许有空值(注意和主键不同)。如果是用组合索引创建,则列值的组合必须唯一。添加唯一键将自动创建唯一索引。
- 直接创建唯一索引:
CREATE UNIQUE INDEX 索引名 ON 表名(列名);
create unique index cardid_index on member(cardid);
- 修改表方式创建:
ALTER TABLE 表名 ADD UNIQUE 索引名 (列名);
- 创建表的时候指定:
CREATE TABLE 表名 (字段1 数据类型,字段2 数据类型[,...],UNIQUE 索引名 (列名));
4.3 主键索引
是一种特殊的唯一索引,必须指定为“PRIMARY KEY”。一个表只能有一个主键,不允许有空值。添加主键将自动创建主键索引。
- 修改表方式创建:
ALTER TABLE 表名 ADD PRIMARY KEY (列名);
alter table member add primary key (id);
4.4 组合索引(单列索引与多列索引)
可以是单列上创建的索引,也可以是在多列上创建的索引。需要满足最左原则,因为select语句的where条件是依次从左往右执行的,所以在select语句查询时where条件使用的字段顺序必须和组合索引中的排序一致,否则索引将不会生效。
4.5 全文索引(FULLTEXT)
适合在进行模糊查询的时候使用,可用于在一篇文章中检索文本信息。在 MySQL5.6 版本以前
FULLTEXT 索引仅可用于 MyISAM 引擎,在 5.6 版本之后 innodb 引擎也支持 FULLTEXT 索引。全文索引可以在 CHAR、VARCHAR 或者 TEXT 类型的列上创建。
- 直接创建索引:
CREATE FULLTEXT INDEX 索引名 ON 表名 (列名);
- 修改表方式创建:
ALTER TABLE 表名 ADD FULLTEXT 索引名 (列名);
alter table member add fulltext remark_index (remark);
- 创建表的时候指定索引:
CREATE TABLE 表名 (字段1 数据类型[,...],FULLTEXT 索引名 (列名));
#数据类型可以为 CHAR、VARCHAR 或者 TEXT
- 使用全文索引查询:
SELECT * FROM 表名 WHERE MATCH(列名) AGAINST('查询内容');
5. 查看索引
show index from 表名;
show keys from 表名;
各字段的含义如下:
- Table:表的名称。
- Non_unique:如果索引不能包括重复词,则为 0;如果可以,则为 1。
- Key_name:索引的名称。
- Seq_in_index:索引中的列序号,从 1 开始。
- Column_name:列名称。
- Collation:列以什么方式存储在索引中。在 MySQL 中,有值‘A’(升序)或 NULL(无分类)。
- Cardinality:索引中唯一值数目的估计值。
- Sub_part:如果列只是被部分地编入索引,则为被编入索引的字符的数目。如果整列被编入索引,则为 NULL。
- Packed:指示关键字如何被压缩。如果没有被压缩,则为 NULL。
- Null:如果列含有 NULL,则含有 YES。如果没有,则该列含有 NO。
- Index_type:用过的索引方法(BTREE, FULLTEXT, HASH, RTREE)。
- Comment:备注。
6.删除索引
- 直接删除索引:
DROP INDEX 索引名 ON 表名;
- 修改表方式删除索引:
ALTER TABLE 表名 DROP INDEX 索引名;
- 删除主键索引:
ALTER TABLE 表名 DROP PRIMARY KEY;
二、MySQL事务
1.事务的概念
- 事务是一种机制、一个操作序列,包含了一组数据库操作命令,并且把所有的命令作为一个整体一起向系统提交或撤销操作请求,即这一组数据库命令要么都执行,要么都不执行。
- 事务是一个不可分割的工作逻辑单元,在数据库系统上执行并发操作时,事务是最小的控制单元。
- 事务适用于多用户同时操作的数据库系统的场景,如银行、保险公司及证券交易系统等等。
- 事务通过事务的整体性以保证数据的一致性。
- 事务能够提高在向表中更新和插入信息期间的可靠性。
2.事务的ACID特点
ACID,是指在可靠数据库管理系统(DBMS)中,事务(transaction)应具有的四个特性原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。这是可靠数据库所应具备的几个特性。
原子性:
- 指事务是一个不可再分割的工作单位,事务中的操作要么都发生,要么都不发生。
- 事务是一个完整的操作,事务的各元素是不可分的。
- 事务中的所有元素必须作为一个整体提交或回滚。
- 如果事务中的任何元素失败,则整个事务将失败。
一致性:
- 指在事务开始之前和事务结束以后,数据库的完整性约束没有被破坏。
- 当事务完成时,数据必须处于一致状态。
- 在事务开始前,数据库中存储的数据处于一致状态。
- 在正在进行的事务中,数据可能处于不一致的状态。
- 当事务成功完成时,数据必须再次回到已知的一致状态。
隔离性:
- 指在并发环境中,当不同的事务同时操纵相同的数据时,每个事务都有各自的完整数据空间。
- 对数据进行修改的所有并发事务是彼此隔离的,表明事务必须是独立的,它不应以任何方式依赖于或影响其他事务。
- 修改数据的事务可在另一个使用相同数据的事务开始之前访问这些数据,或者在另一个使用相同数据的事务结束之后访问这些数据。
- 也就是说并发访问数据库时,一个用户的事务不被其他事务所干扰,各并发事务之间数据库是独立的。
3.一致性问题
当多个客户端并发地访问同一个表时,可能出现下面的一致性问题:
- 脏读:当一个事务正在访问数据,并且对数据进行了修改,而这种修改还没有提交到数据库中,这时,另外一个事务也访问这个数据,然后使用了这个数据。
- 不可重复读:指在一个事务内,多次读同一数据。在这个事务还没有结束时,另外一个事务也访问该同一数据。那么,在第一个事务中的两次读数据之间,由于第二个事务的修改,那么第一个事务两次读到的的数据可能是不一样的。这样就发生了在一个事务内两次读到的数据是不一样的,因此称为是不可重复读。(即不能读到相同的数据内容)
- 幻读:一个事务对一个表中的数据进行了修改,这种修改涉及到表中的全部数据行。同时,另一个事务也修改这个表中的数据,这种修改是向表中插入一行新数据。那么,操作前一个事务的用户会发现表中还有一个没有修改的数据行,就好象发生了幻觉一样。
- 丢失更新:两个事务同时读取同一条记录,A先修改记录,B也修改记录(B不知道A修改过),B提交数据后B的修改结果覆盖了A的修改结果。
4.事务隔离
4.1 概述
MySQL事务支持如下四种隔离,用以控制事务所做的修改,并将修改通告至其它的并发的事务
- 未提交读(Read Uncommitted(RU)):
允许脏读,即允许一个事务可以看到其他事务未提交的修改。 - 提交读(Read Committed(RC)):
允许一个事务只能看到其他事务已经提交的修改,未提交的修改是不可见的。防止脏读。 - 可重复读(Repeatable Read(RR)):
mysql的默认隔离级别,确保如果在一个事务中执行两次相同的SELECT语句,都能得到相同的结果,不管其他事务是否提交这些修改。可以防止脏读和不可重复读。 - 串行读(Serializable):
相当于锁表,完全串行化的读,将一个事务与其他事务完全的隔离。每次读都需要获得表级共享锁,读取相互都会阻塞。可以防止脏读、不可重复读取和幻读。
mysql默认的事务处理级别是 repeatable read ,而Oracle和SQL Server是 read committed
事务隔离的级别的作用范围分为两种:
- 全局级:对所有的会话有效
- 会话级:只对当前的会话有效
4.2 操作
- 查询全局事务隔离级别:
show global variables like '%isolation%';
SELECT @@global.tx_isolation;
- 查询会话事务隔离级别:
show session variables like '%isolation%';
SELECT @@session.tx_isolation;
SELECT @@tx_isolation;
- 设置全局事务隔离级别:
set global transaction isolation level read committed;
set @@global.tx_isolation='read-committed'; #重启服务后失效
- 设置会话事务隔离级别:
set session transaction isolation level repeatable read;
set @@session.tx_isolation='repeatable-read';
5.事务控制语句
- BEGIN 或 START TRANSACTION:显式地开启一个事务。
- COMMIT 或 COMMIT WORK:提交事务,并使已对数据库进行的所有修改变为永久性的。
- ROLLBACK 或 ROLLBACK WORK:回滚会结束用户的事务,并撤销正在进行的所有未提交的修改。
- SAVEPOINT S1:使用 SAVEPOINT 允许在事务中创建一个回滚点,一个事务中可以有多个 SAVEPOINT;“S1”代表回滚点名称。
- ROLLBACK TO [SAVEPOINT] S1:把事务回滚到标记点。
6.使用set设置控制事务
SET AUTOCOMMIT=0;#禁止自动提交
SET AUTOCOMMIT=1;#开启自动提交,Mysql默认为1
SHOW VARIABLES LIKE 'AUTOCOMMIT';#查看Mysql中的AUTOCOMMIT值
- 如果没有开启自动提交,当前会话连接的mysql的所有操作都会当成一个事务直到你输入rollback|commit;当前事务才算结束。当前事务结束前新的mysql连接时无法读取到任何当前会话的操作结果。
- 如果开起了自动提交,mysql会把每个sql语句当成一个事务,然后自动的commit。
当然无论开启与否,begin; commit|rollback; 都是独立的事务。
三、MySQL存储引擎
1.常用的存储引擎
MyISAM:不支持事务和外键约束,占用资源较小,访问速度快,标记锁定,支持全文索引,适用于不需要事务处理,单独写入或查询的应用场景。
InnoDB:支持事务处理、外键约束,缓存能力较好,支持行级锁定,读写并发能力较好,5.5版本后支持全文索引,适用于一致性要求高、数据更新频繁的应用场景。
2.MyISAM存储格式
MyISAM表支持3种不同的存储格式:
1.静态(固定长度表):
静态表是默认的存储格式。静态表中的字段都是非可变字段,这样每个记录都是固定长度的,这种存储方式的优点是存储非常迅速,容易缓存,出现故障容易恢复;缺点是占用的空间通常比动态多。
2.动态表:
动态表包含可变字段,记录不是固定长度的,这样存储的优点是占用空间较少,但是频繁的更新、删除记录会产生碎片,需要定期执行 OPTIMIZE TABLE 语句或 myisamchk -r 命令来改善性能,并且出现故障的时候恢复相对比较困难。
3.压缩表:
压缩表有myisamchk工具创建,占据非常小的空间,因为每条记录都是被单独压缩的,所以只有非常小的访问开支。
3.操作
#查看系统支持的存储引擎
show engines;
#查看表使用的存储引擎
方法一:
show table status from 库名 where name='表名'\G
方法二:
use 库名;
show create table 表名;
#修改存储引擎
1.通过 alter table 修改
use 库名;
alter table 表名 engine=MyISAM;
2.通过修改 /etc/my.cnf 配置文件,指定默认存储引擎并重启服务
vim /etc/my.cnf
......
[mysqld]
......
default-storage-engine=INNODB
systemctl restart mysql.service
#注意:此方法只对修改了配置文件并重启mysql服务后新创建的表有效,已经存在的表不会有变更。
3.通过 create table 创建表时指定存储引擎
use 库名;
create table 表名(字段1 数据类型,...) engine=MyISAM;
四、死锁
1.概述
所谓死锁:
是指两个或两个以上的事务在执行过程中,因争夺锁资源而造成的一种互相等待的现象,若无外力作用,事务都将无法继续运行。此时称系统处于死锁状态或系统产生了死锁。
例如,如果事务A锁住了记录1并等待记录2,而事务B锁住了记录2并等待记录1,这样两个事务就发生了死锁现象。计算机系统中,如果系统的资源分配策略不当,更常见的可能是程序员写的程序有错误等,则会导致进程因竞争资源不当而产生死锁的现象。
死锁导致长时间阻塞的危害:
众所周知,数据库的连接资源是很珍贵的,如果一个连接因为事务阻塞长时间不释放,那么后面新的请求要执行的sql也会排队等待,越积越多,最终会拖垮整个应用。一旦你的应用部署在微服务体系中而又没有做熔断处理(当某服务出现不可用或响应超时的情况时,会暂时停止对该服务的调用),由于整个链路被阻断,那么就会引发雪崩效应,导致很严重的生产事故。
2.如何避免死锁
1.设置锁等待超时时间:
即两个事务相互等待时,一旦等待时间超过了这个时间之后,那么超时事务回滚释放资源,另一个事务就能正常执行了。
在 InnoDB 存储引擎中,参数 innodb_lock_wait_timeout 是用来设置超时时间的,默认值为 50 秒。 show VARIABLES like 'innodb_lock_wait_timeout';
参数 innodb_rollback_on_timeout 表示是否在等待超时时对进行中的事务进行回滚操作(默认是OFF,代表不回滚)。
2.主动开启死锁检测:
当 innodb 检测发现死锁之后,就会进行回滚死锁的事物。
show VARIABLES like 'innodb_deadlock_detect'; #查看当前死锁检测是否开启
set global innodb_deadlock_detect = ON;#ON为开启死锁检测,OFF为关闭
3.使用更合理的业务逻辑:
对于数据库的多表操作时,尽量按照相同的顺序进行处理,尽量避免同时锁定多个资源。
4.保持事务简短:
减少对资源的占用时间和占用范围,避免长事务,减少完成事务可能的延迟并释放锁。
5.为表添加合理的索引:
如果不使用索引将会发生全表扫描,扫描时间长,占用资源多,且耗时,会导致死锁的概率大大增加。
6.降低隔离级别:
如果业务允许,将隔离级别调低也是较好的选择,比如将隔离级别从RR调整为RC,可以避免掉很多因为间隙锁造成的死锁。
7.读多写少的场景下使用乐观锁机制:
读取数据不上锁,在读的情况下可以共享资源,这样可以省去了锁的开销,提高了吞吐量。
- 乐观锁:乐观锁在操作数据时非常乐观,认为别人不会同时修改数据。因此乐观锁不会上锁,只是在执行更新的时候判断一下在此期间别人是否修改了数据,如果别人修改了数据则放弃操作,否则执行操作。适用于读多写少的场景。
SELECT * from t1 where id = 1 lock in share MODE;
- 悲观锁:悲观锁在操作数据时比较悲观,认为别人会同时修改数据。因此操作数据时直接把数据锁住,直到操作完成后才会释放锁;上锁期间其他人不能修改数据。一般适用于写多的场景。
SELECT * from t1 where id = 1 for update;
原文地址:https://blog.csdn.net/2401_85983616/article/details/142921807
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!