超详细:三大范式设计+反范式设计+树
范式基础
范式的概念
设计数据库的时候需要遵从的一些规范,目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)
当然正常情况下我们满足前三个范式就可以设计一个比较规范的数据库
要遵循后边的范式,就必须先遵循前面的范式要求,比如第二范式就必须先遵循第一范式的,第三范式必须先遵循第二范式,以此类推
三大范式
三大范式概念
第一范式(1NF):每个列都不可以再拆分。
第二范式(2NF):在第一范式的基础上,非主键列完全依赖于主键,而不能是依赖于主键的一部分。
第三范式(3NF):在第二范式的基础上,非主键列只依赖于主键,不依赖于其他非主键。
三大范式举例
比如我们有一个表,以后的例子会对这个表进行三大范式的改造,然后把他变成规范的表:
进行第一范式的改造
第一范式(1NF):每个列都不可以再拆分
我们可以看到表中有一列可以再分,那就是系,所以把他进行第一范式的改造就变成了:
进行第二范式的改造
第二范式(2NF):在第一范式的基础上,非主键列完全依赖于主键,而不能是依赖于主键的一部分。
这第二范式不好理解,那么我们先了解几个概念:
1、函数依赖:如果通过A属性(属性组),可以确定唯一B属性的值,那么B依赖于A。比如上图的姓名,完全依赖于学号
2、完全函数依赖:如果A是一个属性组,则B属性值的确定需要依赖于A属性组中的所有的属性值。属性组是指多个字段,那么比如我们要想知道一个分数,就必须依赖于学号和课程名称两个属性才能确定一个分数,其他的属性是不能确定某一个分数的
3、部分函数依赖:如果A是一个属性组,则B属性值的确定需要依赖A属性组的某一些字段即可,例如学号和课程名称为一个属性组,那么学生姓名其实就只需要学号就可以确定
4、传递函数依赖:如果A属性(属性组),可以确定唯一个B属性的值,再通过B属性的值又可以唯一确定C属性的值,例如一个学号确定一个系名,一个系名对应一个系主任
5、主键:在一张表中,一个属性或者属性组,被其他所有属性完全依赖,则称这个属性为该码的表,比如上图的学号和课程名称组成的属性组
其实第二范式就是还可以理解为
在第一范式的基础上消除非主键对主键的部分依赖
那么我们上图的主键为学号加课程名称组成的属性组,对于上图,我们可以看到,除了分数其他的都对主键是部分依赖,那么我们可以按照下图的方式进行改正:
经过第二范式的改造把一个表分成两个表,那么我们发现其实第二范式为我们消除了很多冗余的部分,比如改造前张无忌的姓名系名系主任在表中出现了三次,而改造后在两表才出现一次。
进行第三范式的改造
第三范式(3NF):在第二范式的基础上,非主键列只依赖于主键,不依赖于其他非主键。
根据第二点我们说的概念,修改后变成:
反范式设计
反范式设计是一种与传统规范化设计相对的数据库设计方法,它允许在数据库中引入冗余数据以提高查询性能或简化查询操作。反范式设计的主要思想是通过增加冗余数据来消除关系型数据库中的连接操作,从而提高查询性能。
反范式设计的特点
反范式设计在某些特定场景下可以提供较高的性能和简化查询操作,例如大型数据仓库、报表生成和实时大数据处理等情况。它允许数据冗余,以提高查询性能。适用于需要频繁读取数据且对写入性能要求不高的场景。
反范式设计的适用场景
反范式设计适用于以下场景:
- 大型数据仓库:在处理大量数据时,反范式设计可以显著提高查询性能。
- 报表生成:在需要快速生成复杂报表时,反范式设计可以简化查询操作。
- 实时大数据处理:在需要快速响应的实时数据处理场景中,反范式设计可以提高处理速度。
反范式设计的优缺点
优点:
- 提高查询性能:通过引入冗余数据,减少数据库的连接操作,从而提高查询速度。
- 简化查询操作:减少复杂的SQL查询,提高查询效率。
- 适用于特定场景:在大数据处理、报表生成等场景下表现优异。
缺点:
- 数据冗余:可能会导致数据的一致性和完整性问题。
- 维护复杂:需要更新多个地方的数据以确保数据的一致性,增加了维护的复杂性。
说白了反范式设计就是用内存来换效率!!!
原文地址:https://blog.csdn.net/Bisikl/article/details/143667107
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!