系统架构师（3）数据库技术

文章目录数据库技术基本概念三级模式-两级映像数据库设计E-R模型关系模型模型转换关系代数运算数据库技术基本概念数据库系统DBS是一个采用了数据库技术,有组织地、动态地存储大量相关数据，方便多用户访问的计算机系统。其由下面四个部分组成:数据库（统一管理、长期存储在计算机内的,有组织的相关数据的集合)硬件(构成计算机系统包括存储数据所需的外部设备)软件(操作系统、数据库管理系统及应用程序)人员（系统分

歪桃

8740人浏览 · 2021-08-09 11:52:07

歪桃 · 2021-08-09 11:52:07 发布

1.数据库技术基本概念

数据库系统DBMS是一个采用了数据库技术,有组织地、动态地存储大量相关数据，方便多用户访问的计算机系统。其由下面四个部分组成。
在这里插入图片描述
数据库管理系统DBMS的功能
实现对共享数据有效的组织、管理和存取。
包括数据定义、数据库操作、数据库运行管理、数据的存储管理、数据库的建立和维护等。

2.三级模式-两级映像

三级模式
在这里插入图片描述
两级映像

在数据库系统中，数据库的视图、基本表和存储文件的结构分别与(）对应;数据的物理独立性和数据的逻辑独立性是分别通过修改(）来完成的。
A.模式、外模式、内模式
B.模式、内模式、外模式
C.外模式、模式、内模式
D.外模式、内模式、模式
A.模式与内模式之间的映像、外模式与模式之间的映像
B.外模式与内模式之间的映像、外模式与模式之间的映像
C.外模式与模式之间的映像、模式与内模式之间的映像
D.外模式与内模式之间的映像、模式与内模式之间的映像
答案: C A

3.数据库设计

在这里插入图片描述

在数据库逻辑结构设计阶段，需要(51）阶段形成的(52）作为设计依据。
(51)
A．需求分析
B．概念结构设计
C．物理结构设计
D.数据库运行和维护
(52)
A．程序文档、数据字典和数据流图
B．需求说明文档、程序文档和数据流图
C．需求说明文档、数据字典和数据流图
D．需求说明文档、数据字典和程序文档
答案:A C
解析:看第二个问的选项可知每个选项都包括需求分析阶段的产物，因此可得出第一问肯定是需求阶段。需求阶段形成的需求说明文档、数据字典和数据流图作为逻辑设计的依据。

3.1.E-R模型

数据模型三要素
在这里插入图片描述
E-R模型

3.2.关系模型

关系模型也即数据库中常用的表，包括实体的属性,标识出实体的主键和外键,如下:
S(Sno,Sname,SD,Sage,Sex);学生S关系模式，属性为学号、姓名、系、年龄和性别。T(Tno,Tname,Age,Sex) :教师T关系模式，属性为教师号、姓名、年龄和性别。
C(Cno,Cname,Pcno):课程C关系模式,属性为课程号、课程名和先修课程号。
sC(Sno, Cno,Grade)学生选课SC 关系模式，属性为学号、课程号和成绩。

3.3.模型转换

E-R图转换为关系模型;每个实体都对应一个关系模式;联系分为三种:
在这里插入图片描述
例(2012年上半年):E-R模型向关系模型转换时，三个实体之间多对多的联系m:n:p应该转换为一个独立的关系模式，且该关系模式的关键字由___组成。
A．多对多联系的属性
B．三个实体的关键字
C．任意一个实体的关键字
D．任意两个实体的关键字
答案:B
解析:将E-R模型转换成相应的关系模式时，若实体间联系是m:n:p，则将联系类型单独转换成一个关系模式，其属性为3端实体类型的主键(作为外键)加上联系类型自身的属性，而该关系模式的主键为3端实体主键的组合。

4.关系代数运算

在这里插入图片描述
给定关系 R(A,B,C,D)和关系 S(C，D，E)，对其进行自然连接运算 R ⋈ S 后的属性列为（）个；与σR.B>S.E(R ⋈ S)等价的关系代数表达式为（）。
A．4
B．5
C．6
D．7
A．σ2＞7(R×S)
B．π1,2,3,4,7(σ´2´＞´7´Λ3=5Λ4=6(R×S）)
C．σ’2’＞’7’(R×S)
D．π1,2,3,4,7(σ2＞7Λ3=5Λ4=6(R×S))
在这里插入图片描述
解析
1.对R与S做自然联接运算时，联接条件为: R.C=S.C and R.D=S.D.运算结果会自动去重复列，所以结果的列为: A、B、C、D、E,一共5列。
σR.B>S.E(R ⋈ S)表示为R和S的自然连接，并且其中R.B>S.E。
2.从第1问可知，结果的列为: A(1)、B(2)、C(3)、D(4)、E(7),一共5列，
因此选择这5列的表达式为：π1,2,3,4,7。用sql表示为 select A(1),B(2),C(3),D(4),E(7)
σR.B>S.E则表示为：σ2＞7。用sql表示为 where R.B(2)>S.E(7)
此外自然连接中，连接的前提条件是相同列的元素相同，R和S中，相同列为C，D。因此还需要σ(3)=5Λ4=6，用SQL表示为 where R.C(3)>S.E(5) and R.D(4)>S.D(6)
综上表达式为：π1,2,3,4,7(σ2＞7Λ3=5Λ4=6(R×S))
SQL为： select A(1),B(2),C(3),D(4),E(7) from R,S where R.B(2)>S.E(7) and R.C(3)>S.E(5) and R.D(4)>S.D(6)

5.函数依赖

给定一个X，能唯一-确定一个Y，就称X确定Y，或者说Y依赖于x，例如Y=X*X函数。
函数依赖又可扩展以下两种规则:
在这里插入图片描述

6.键与约束

在这里插入图片描述

7.范式

7.1.第一范式

关系中的每一个分量必须是一个不可分的数据项。通俗地说，第一范式就是表中不允许有小表的存在。比如，对于如下的员工表，就不属于第一范式，因为表头中明确指出，薪资由基本和补贴组成。
在这里插入图片描述

7.2.规范化理论

实例
用一个单一的关系模式学生来描述学校的教务系统。
学生(学号,学生姓名,系号,系主任姓名,课程号,成绩)
依赖关系(学生->学号，学生>学生姓名，学生->系号，系号>系主任姓名，学生->课程号，
(学生，课程号) ->成绩)
在这里插入图片描述

7.3.第二范式

如果关系R属于1NF，且每一个非主属性完全函数依赖于任何一个候选码，则R属于2NF。
通俗地说，2NF就是在1NF的基础上，表中的每一一个非主属性不会依赖复合主键中的某一个
列。
按照定义，上面的学生表就不满足2NF, 因为学号不能完全确定课程号和成绩(每个学生可以
选多门课)。
将学生表分解为:
学生(学号,学生姓名,系编号,系名,系主任)，
选课(学号,课程号,成绩)。
每张表均属于2NF。

7.4.第三范式

在满足1NF的基础上，表中不存在非主属性对码的传递依赖。
继续上面的实例，学生关系模式就不属于3NF，因为学生无法直接决定系主任和系名，是由学号->系编号，再由系编号->系主任，系编号->系名，因此存在非主属性对主属性的传递依赖。
将学生表进一步分解为:
学生(学号，学生姓名，系编号)
系(系编号，系名，系主任)
选课(学号,课程号,成绩)
每张表都属于3NF。

7.5.BC范式

BC范式BCNF
所谓BCNF,是指在第三范式的基础上进一步消除主属性对于码的部分函数依赖和传递依赖。
通俗的来说，就是在每一种情况下，每一个依赖的左边决定因素都必然包含候选键，如下:
在这里插入图片描述

上图中，候选键有两种情况:组合键(S,T)或者(S,J), 依赖集为{SJ- -T, T-I}, 可知，ST)三个
属性都是主属性，因此其达到了3NF (无非主属性)，然而，第二种情况，即(,J)为候选键
的时候，对于依赖T->J, T在这种情况不是候选键，即TJ的决定因素不包含任意候选码，因
此上图不是BCNF.
要使上图关系模式转换为BCNF也很简单，只需要将依赖T->J变为TS->J即可，这样其左边决定
因素就包含了候选键之一S。

给定关系模式R(U,F), U={A,B,C,D}, F={AB>C,CD>B}。关系R (),且分别有( )。
A.只有1个候选关键字ACB
B.只有1个候选关键字BCD
C.有2个候选关键字ACD和ABD
D.有2个候选关键字ACB和BCD

A.0个非主属性和4个主属性
B.1个非主属性和3个主属性
C.2个非主属性和2个主属性
D.3个非主属性和1个主属性
答案: C A
在这里插入图片描述
设有关系模式R (E, N, M, L, Q)，其函数依赖集为F={E >N, EM-Q,
M→L}.则关系模式R达到了_ 53___ ; 该关系模式__ 54_ 。
(53)
A.1NF
B.2NF
C.3NF
D.BCNF

(54)
A.无需进行分解，因为已经达到了3NF
B.无需进行分解，因为已经达到了BCNF
C.尽管不存在部分函数依赖，但还存在传递依赖，所以需要进行分解
D.需要进行分解，因为存在冗余、修改操作的不-一致性、插入和删除异常
答案: A D
解析:由该关系模式，可求出其候选键为EM，而又存在E->N，即候选键中一部分决定其他属
性，存在部分函数依赖，只是1NF; 因为存在部分函数依赖，由此可知第二问ABC都错了，只
有D正确。

7.6.模式分解

范式之间的转换一般都是通过拆分属性，即模式分解，将具有部分函数依赖和传递依赖的属性
分离出来，来达到一步步优化，- ~般分为以下两种:
保持函数依赖分解
对于关系模式R，有依赖集F，若对R进行分解，分解出来的多个关系模式，保持原来的依赖集
不变，则为保持函数依赖的分解。另外，注意要消除掉冗余依赖(如传递依赖)。
实例:设原关系模式R(A,B,C)，依赖集F(A->B, B->C, A->C)，将其分解为两个关系模式R1(A,B)和
R2(B,C),此时R1中保持依赖A->B, R2保持依赖B->C，说明分解后的R1和R2是保持函数依赖的
分解，因为A->C这个函数依赖实际是-一个冗余依赖，可以由前两个依赖传递得到，因此不需要
管。
无损分解:分解后的关系模式能够还原出原关系模式，就是无损分解，不能还原就是有损。
可以通过表格法求解，如下：
在这里插入图片描述
当分解为两个关系模式，除了表格法以外，还可以通过以下定理判断是否无损分解:
定理:如果R的分解为p={R1, R2}, F为R所满足的函数依赖集合，分解p具有无损连接性的充分
必要条件是R1∩R2->(R1-R2)或者R1∩R2->(R2-R1)。

给定关系模式R<U, F>, U={A, B, C, D, E}, F={B→A， D>A, A→E，AC>B},则R的候选关键字为( )，分解p={R1 (ABCE)，R2 (CD)} ( )。
A.CD
B.ABD
C.ACD
D.ADE
A.具有无损连接性，且保持函数依赖
B.不具有无损连接性，但保持函数依赖
C.具有无损连接性，但不保持函数依赖
D.不具有无损连接性，也不保持函数依赖
答案: A
D

8.事务管理

事务提交commit,事务回滚rollback.

8.1.事务ACID特性

事务:由一-系列操作组成，这些操作，要么全做，要么全不做，拥有四种特性
在这里插入图片描述

例:“当多个事务并发执行时，任一事务的更新操作直到其成功提交的整个过程对其他事务都是不可见的”，这一性质通常被称为事务的(53)。
(53) A.原子性
B.一致性
C.隔离性
D.持久性
答案: C
解析:对其他事务不可见，即该事务被隔离了，从字面也可以理解。

8.2.并发控制

事务是并发控制的前提条件，并发控制就是控制不同的事务并发执行，提高系统效率，但是并发控制中存在下面三个问题:
在这里插入图片描述

8.3.封锁协议

在这里插入图片描述

例:若事务T1对数据D1加了共享锁，事务T2、T3分别对数据D2、D3加了排它锁，则事务T1对数据(51) ;事务T2对数据(52)
51
A. D2、D3加排它锁都成功
B. D2、D3加共享锁都成功
C. D2加共享锁成功，D3 加排它锁失败
D. D2、D3 加排它锁和共享锁都失败
52
A. D1、D3加共享锁都失败
B. D1、D3 加共享锁都成功
C. D1加共享锁成功，D3如排它锁失败
D. D1加排它锁成功，D3 加共享锁失败
答案:D C
解析:
共享锁，顾名思义，就是可以共享，因此T2、 T3还可以对D1再加共享锁;排
它锁，很明显，就是不能再由其他事务进行任何操作，既不能再共享也不能再排它。

9.数据库安全

9.1.安全措施和级别

在这里插入图片描述

9.2.数据故障

在这里插入图片描述

9.3.数据库备份

在这里插入图片描述
为了保证数据库中数据的安全可靠和正确有效，系统在进行事务处理时，对数据的插入、删除或修改的全部有关内容先写入(51);当系统正常运行时，按一定的时间间隔，把数据库缓冲区内容写入(52) ;当发生故障时，根据现场数据内容及相关文件来恢复系统的状态。
(51)
A.索引文件
B.数据文件
C.日志文件
D.数据字典
(52)
A.索引文件
B.数据文件
C.日志文件
D.数据字典
答案: C B
解析:在数据库中引入了日志文件，记录系统进行事务处理时的-切操作，但只记录操作内容，
数据是存放在数据文件中，恢复现场时，依据日志文件可知有哪些操作，依据数据文件可知操
作的数据是哪些。

10.分布式数据库

局部数据库位于不同的物理位置，使用一个全局DBMS将所有局部数据库联网管理，这就是分布式数据库。其体系结构如下图所示:
在这里插入图片描述

11.数据仓库

数据仓库是一种特殊的数据库，也是按数据库形式存储数据的，但是目的不同:数据库经过长时间的运行，里面的数据会保存的越来越多，就会影响系统运行效率，对于某些程序而言，很久之前的数据并非必要的，因此，可以删除掉以减少数据，增加效率，考虑到删除这些数据比较可惜，因此，一般都将这些数据从数据库中提取出来保存到另外一个数据库中，称为数据仓库。

由此，可知，数据仓库的目的不是为了应用，是面向主题的，用来做数据分析，集成不同表，而且是相对稳定的，一般般不会做修改，同时会在特定的时间点，做大量的插入，反映历史的变化。
在这里插入图片描述
依据上述，可以提炼出数据仓库的形成过程。
如下图所示:

12.数据挖掘

数据仓库作用
由上图可知，形成数据仓库后，有两个作用，-一个是用来做数据的查询、分析、生成报表。另一个是使用数据挖掘工具对这些历史数据进行挖掘，查找数据间的关系，发现剩余价值。

数据挖掘的分析方法
在这里插入图片描述

13.商业智能

BI系统主要包括数据预处理、建立数据仓库、数据分析和数据展现四个主要阶段。
数据预处理是整合企业原始数据的第一步，它包括数据的抽取(Extraction) 、转换(Transformation)和加载(Load) 三个过程(ETL过程) ;
建立数据仓库则是处理海量数据的基础;
数据分析是体现系统智能的关键，一般采用联机分析处理(OLAP)和数据挖掘两大技术。联机分析处理不仅进行数据汇总/聚集，同时还提供切片、切块、下钻、上卷和旋转等数据分析功能，用户可以方便地对海量数据进行多维分析。数据挖掘的目标则是挖掘数据背后隐藏
的知识，通过关联分析、聚类和分类等方法建立分析模型，预测企业未来发展趋势和将要面临的问题;
在海量数据和分析手段增多的情况下，数据展现则主要保障系统分析结果的可视化。

数据仓库中数据( )的特点是指数据一且进入数据仓库后，将被长期保留并定期加载和刷新，可以进行各种查询操作，但很少对数据进行修改和删除操作。
A.面向主题
B.集成性
C.相对稳定性
D.反映历史变
化
答案: C

数据挖掘的分析方法可以划分为关联分析、序列模式分析、分类分析和聚类分析四种。如果某方法需要一个示例库(该库中的每个元组都有-一个给定的类标识)做训练集时，这种分析
方法属于().
A.关联分析
B.序列模式分析
C.分类分析
D.聚类分析
答案: C

14.反规范化技术

由前面介绍可知，规范化操作可以防止插入异常、更新、删除异常和数据冗余，一般是通过模式分解，将表拆分，来达到这个目的。
但是表拆分后，解决了，上述异常，却不利于查询，每次查询时，可能都要关联很多表，严重降低了查询效率，因此，有时候需要使用反规范化技术来提高查询效率。
技术手段包括:增加派生性冗余列，增加冗余列，重新组表，分割表。
主要就是增加冗余，提高查询效率，为规范化操作的逆操作。

15.大数据

特点:大量化、多样化、价值密度低、快速化。
大数据和传统数据的比较如下:
在这里插入图片描述

要处理大数据，一般使用集成平台，称为大数据处理系统，其特征为:高度可扩展性、高性能、高度容错、支持异构环境、较短的分析延迟、易用且开放的接口、较低成本、向下兼容性。

16.SQL语言

在这里插入图片描述

某销售公司数据库的零件关系P(零件号，零件名称，供应商，供应商所在地，库存量)，函数依赖集F={零件号>零件名称，(零件号，供应商)>库存量，供应商>供应商所在地}。零件关系P属于_ 54___ 。查询各种零件的平均库存量、最多库存量与最少库存量之间差值的SOl语句如下:SELECT零件号，_ 55___FROM P 56_ ;
54
A.1NF
B.2NF
C.3NF
D.4NF

55
A. AVG(库存量)AS平均库存量，MAX(库存量)- MIN(库存量)AS差值
B.平均库存量AS AVG(库存量)，差值AS MAX(库存量)-MIN(库存量)
C. AVG库存量AS平均库存量，MAX库存量-MIN库存量AS差值
D.平均库存量AS AVG库存量，差值AS MAX库存量一MIN库存量

56
A. ORDER BY供应商
B. ORDER BY零件号
C. GROUP BY供应商
D. GROUP BY零件号
答案:A A D
解析:依题意，基于函数依赖集F，零件P关系中的(零件号，供应商)可决定零件P关系的所有属性，因此零件P关系的主键为(零件号，供应商)。又因为“(零件号，供应商)>零件名称”，而“零件号>零件名称”、“供应商 >供应商所在地”，由此可知零件名称和供应商所在地都部分依赖于码，所以关系模式P∈1NF。查询各种零件的平均库存量、最多库存量与最少库存量之间差值时，首先需要在结果列中的第一空缺处填入“AVG(库存量)AS平均库存量，MAX(库存量)-MIN(库存量)AS差值"。其次必须用分组语句按零件号分组，因第二空缺处应填入“GROUP BY零件号"。

在这里插入图片描述

Cloudpods

开源、云原生的融合云平台

更多推荐

面向未来的 IT 基础设施管理架构——融合云（Unified IaaS）

随着数字化时代的到来，IT系统已成为人类社会正常运转不可或缺的组成部分。不远的未来，智能制造，5G和人工智能等技术将成为推动生产力发展的重要引擎，人类社会将面临前所未有的全面彻底的数字化浪潮。IT基础设施作为IT系统运行的平台和载体，是实现数字化的基石。在这场数字化浪潮中，企业必须积极拥抱云计算技术，采用符合技术发展趋势、面向未来的IT基础构架，才能在未来的竞争中赢得先机。一、云计算历经十余年

Cloudpods

Cloudpods负载均衡的功能介绍

作者:周有松今天的内容会从以下几个方面展开：负载均衡产品简介。主要介绍负载均衡作为一个云上产品，它的功能模型是怎样的，日常使用中会遇到的业务词汇负载均衡的功能与典型应用场景。这部分主要结合业务词汇，对负载均衡服务中常见的一些功能选项进行介绍，并举例介绍一些典型的应用场景最后，我们做一下总结，讨论一下负载均衡产品相比传统方式的优点一、产品简介 1. 以NGINX为例提到负载均衡，我们以

Cloudpods

使用Linux vfio将Nvidia GPU透传给QEMU虚拟机

Linux 上虚拟机 GPU 透传需要使用 vfio 的方式。主要是因为在 vfio 方式下对虚拟设备的权限和 DMA 隔离上做的更好。但是这么做也有个缺点，这个物理设备在主机和其他虚拟机都不能使用了。 qemu 直接使用物理设备本身命令行是很简单的，关键在于事先在主机上对系统、内核和物理设备的一些配置。单纯从 qemu 的命令行来看，其实和普通虚拟机启动就差了最后那个-device的选项。这

Cloudpods

所有评论(0)

查看更多评论

歪桃

@m0_37892044

已为社区贡献5条内容