自学内容网 自学内容网

软考:软件设计师 — 3.数据库系统

三. 数据库系统

1. 数据库的基本概念

(1)数据库系统的体系结构

  • 集中式数据库系统

数据是集中的,数据管理也是集中的,数据库系统的素有功能都集中在 DBMS 所在的计算机。

  • C/S 结构

即客户端和系统端,客户端负责数据表示服务,服务器负责数据库服务,数据库系统分为前端和后端。如 ODBC、JDBC。

  • 分布式数据库

物理上分布、逻辑上集中;物理上分布,逻辑上分布;特点;透明性。

  • 并行数据库

共享内存式和无共享式。

分布式数据库特点:

  • 数据独立性:除了数据的逻辑独立性与物理独立性外,还有数据分布独立性。
  • 集中与自治共享结合的控制结构:各局部的 DBMS 可以独立地管理局部数据库,具有自治的功能。同时,系统又设有集中控制机制,协调各局部 DBMS 的工作,执行全局应用。
  • 适当增加数据冗余度:在不同的场地存储同一数据的多个副本,可以提高系统的可靠性和可用性,同时也能提高系统性能。

(提高系统的可用性是指,当系统中某个节点发生故障时,因为数据有其它副本在非故障场地上,对其它所有场地来说,数据仍然是可用的,从而保证数据的完备性。)

  • 全局的一致性、可串行性和可恢复性。

分布式数据库透明性:

  • 分片(分块)透明:用户不必关心数据是如何分片的,它们对数据的操作在全局关系上进行。
  • 复制透明:用户不用关心数据库在网络中各个节点的复制情况,被复制的数据的更新都由系统自动完成。
  • 位置透明:用户不必知道所操作的数据放在何处,即数据分配到哪个或哪些站点存储。
  • 局部映像透明性(逻辑透明):最低层次的透明性,该透明性提供数据到局部数据库的映像,即用户不必关心局部 DBMS 支持哪种数据模型、使用哪种数据操纵语言,数据模型和操纵语言的转换是由系统完成的。因此,局部映像透明性对异构型和同构异质的分布式数据库系统是非常重要的。

例题1:

在分布式数据库中有分片透明、复制透明、位置透明和逻辑透明等基本概念,其中:()是指局部数据模型透明,即用户或应用程序无需知道局部使用的是哪种数据模型;()是指用户或应用程序不需要知道逻辑上访问的表具体是如何分块存储的。

A.分片透明  B.复制透明  C.位置透明  D.逻辑透明

A.分片透明  B.复制透明  C.位置透明  D.逻辑透明

解析1:

根据数据库透明性的定义可知,局部数据模型透明是指逻辑透明,选 D。用户无需知道逻辑上访问的表具体是如何分块存储的,这是指分片透明。选 A。

例题2:

当某一场地故障时,系统可以使用其他场地上的副本而不至于使整个系统瘫痪。这称为分布式数据库的()。

A.共享性  B.自治性  C.可用性  D.分布性

解析2:

由分布式数据库特点可知,这是分布式数据库的可用性,选 D。共享性是指数据库系统所有数据都是共享的,没有完全分隔;自治性指的是各局部的 DBMS 可以独立地管理局部数据库;分布性指的是物理节点上的分布。

(2)三级模式和两级映像

外模式也称为用户模式,概念模式也称为模式,内模式也称为存储模式。

逻辑独立性:数据的逻辑结构发生变化后,用户程序不用修改。但是为了保证应用程序能够正确执行,需要修改外模式和概念模式之间的映射。

物理独立性:数据的物理结构发生变化后,应用程序不用修改。 但是为了保证应用程序能够正确执行,需要修改内模式和概念模式之间的映射。

例题1:

数据库系统通常采用三级模式结构:外模式、模式和内模式。这三级模式分别对应数据库的()。

A.基本表、存储文件和视图。

B.视图、基本表和存储文件。

C.基本表、视图和存储文件。

D.视图、存储文件和基本表。

解析1:

由图示可知,外模式对应视图,模式对应基本表,内模式对应文件,选 B。

例题2:

以下关于数据库两级映像的叙述中,正确的是()。

A.模式/内模式映像实现了外模式到内模式之间的相互转换。

B.模式/内模式映像实现了概念模式到内模式之间的相互转换。

C.外模式/模式映像实现了概念模式到内模式之间的相互转换。

D.外模式/内模式映像实现了外模式到内模式之间的相互转换。

解析2:

由两种映像的定义可知,B 选项正确。其中,没有 D 选项这种映射关系。

例题3:

数据的物理独立性和逻辑独立性分别是通过修改()来完成的。

A.外模式与内模式之间的映像、模式与内模式之间的映像。

B.外模式与内模式之间的映像、外模式与模式之间的映像。

C.外模式与模式之间的映像、模式与内模式之间的映像。

D.模式与内模式之间的映像、外模式与模式之间的映像。

解析3:

由物理独立性和逻辑独立性的定义可知,D 选项正确。

(3)数据仓库

数据仓库的范围通常比数据库大得多。

数据仓库的特点:

  • 面向主题:数据按主题组织。
  • 集成的:消除了源数据中的不一致性,提供整个企业的一致性全局信息。
  • 相对稳定的(非易失的):主要进行查询操作,只有少量的修改和删除操作。
  • 反映历史变化(随着时间变化):记录了企业从过去某一时刻到当前各个阶段的信息,可对发展历程和未来趋势做定量分析和预测。

OLAP:联机分析

OLTP:联机事务

例题:

某集团公司下属有多个超市,每个超市的所有销售数据最终要存入公司的数据仓库中。假设该公司高管需要从时间、地区和商品种类三个维度来分析某家电商品的销售数据,那么最适合采用()来完成。

A.Data Extraction  B.OLAP  C.OLTP  D.ETL

解析:

从三个维度去分析商品的销售数据,采用 OLAP 联机分析更合适,它侧重于数据后期的处理过程。A 项数据提取是在数据预处理阶段,D 项就是数据预处理,C 项 OLTP 联机事务就是我们常用的数据库的数据处理方式,从数据的记录到增删改查等操作,侧重于事务。因此选 B。

2. 数据库设计过程

记住需求分析、概念结构设计、逻辑结构设计三个阶段的产物,以及规范化理论的应用是在逻辑结构设计阶段。

在物理设计阶段,聚簇索引会涉及到物理特性的修改。 

例题:

关系规范化在数据库设计的()。

A.需求分析  B.概念设计  C.逻辑设计  D.物理设计

解析:

根据数据库设计过程图示可知,关系规范化的应用是在数据库设计的逻辑设计阶段,选 C。

3. 概念结构设计

(1)概念设计过程

合并(集成) 局部模型的方法:

  • 多个局部 E-R 图一次集成。
  • 逐步集成,用累加的方式一次集成两个局部 E-R。

合并产生的冲突及解决办法:(针对同一对象)

  • 属性冲突:包括属性域冲突和属性取值冲突。
  • 命名冲突:包括同名异义和异名同义。
  • 结构冲突:包括同一对象在不同应用中具有不同的抽象,以及同一实体在不同局部 E-R 图中所包含的属性个数和属性排列次序不完全相同。

(2)E-R 图

实体:实体是现实世界中可以区别于其它对象的事件或事物。(实体集是实体的集合)

属性:属性是实体某方面的特性。

联系:实体的联系分为实体内部的联系和实体与实体间的联系。实体间的联系类型有:1:*, *:1, *:*

属性的分类:

  • 简单属性和复合属性

简单属性是原子的,不可再分的;复合属性可以细分为更小的部分(即划分为别的属性)。

  • 单值属性和多值属性

定义的属性对于一个特定的实体都只有单独的一个值,称为单值属性;

在某些特定情况下,一个属性可能对应一组值,称为多值属性。

  • NULL 属性:表示无意义或不知道。
  • 派生属性:可以从其他属性得来。

联系的类型:

一对一(1:1);一对多(1:n);多对一(n:1);多对多(m:n)

一对多和多对一有方向性,应注意区分两个实体之间谁是一谁是多。

三元联系:

两个以上不同实体集之间的联系(三元联系);多重度的确定(可根据语义直接转换)

以三元关系中的一个实体作为中心,假设另两个实体都只有一个实例:

  • 若中心实体只有一个实例能与另两个实体的一个实例进行关联,则中心实体的连通数为 "一"。

 一个病房有多个病人和多名医生,一名医生只负责一个病房,一个病人只属于一个病房。

  • 若中心实体有多于一个实例能与另两个实体的实例进行关联,则中心实体的连通数为 "多"。

供应商为多个项目供应多种零件,每个项目可用多个供应商的零件,每种零件可由不同的供应商供应。

同一个实体集内的二元联系:

扩充的 E-R 模型: 

弱实体:在现实世界中有一种特殊的依赖联系,该联系是指某实体是否存在对于另一些实体具有很强的依赖关系,即一个实体的存在必须以另一个实体为前提,而将这类实体称为弱实体,如家属与职工的联系,附件与邮件。

特殊化:在现实世界中,某些实体一方面具有一些共性,另一方面还具有各自的特性,一个实体集可以按照某些特征区分为几个子实体。

聚集:一个联系作为另一个联系的一端。

后续会持续学习整理。


原文地址:https://blog.csdn.net/konghaoran1/article/details/140459429

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!