第二章 关系模型
19. 超键、主键、候选键的定义:
超键(super key):在关系中能唯一标识元组的属性集称为关系模式的超键。
候选键(candidate key):不含有多余属性的超键称为候选键。(候选键可以有多个)
主键(primary key):用户选作元组标识的一个候选键称为主键。(主键是候选键中一个)
20. 关系模式、关系子模式和存储模式:
关系模型基本上遵循数据库的三级体系结构。概念模式是关系模式的集合,外模式是关系子模式的集合,内模式是存储模式的集合。
(1) 关系模式:关系模式实际上是记录类型。它的定义包括:模式名,属性名,值域名以及模式的主键。
(2) 关系子模式:是用户所用到的那部分数据的描述。除了指出用户的数据外,还应指出模式与子模式之间的对应性。
(3) 存储模式:关系存储时的基本组织方式是文件,元组是文件中的记录。存储一个关系可以用散列方法或索引方法实现。如果关系中元组数目较少,也可以用堆文件方式实现。
21. 关系模型的三类完整性规则:
(1) 实体完整性规则:这条规则要求关系中元组在组成主键的属性上不能有空值。
(2) 参照完整性规则:这条规则要求“不引用不存在的实体”。
(3) 用户定义的完整性规则:它反映某一具体应用涉及的数据必须满足的语义要求。
22. 参照完整性规则的形式定义:
如果属性集K是关系模式R1的主键,K也是关系模式R2的外键,那么在R2的关系中,K的取值只允许两种可能,或者为空,或者等于R1关系中某个主键值。
此规则使用时还要注意三点:
(1) 外键和相应的主键可以不同名,只要定义在相同值域上即可。
(2) R1和R2也可以是同一个关系模式,表示了属性之间的联系。
(3) 外键值是否允许空,应视具体问题而定。
上述形式定义中,关系模式R1称为“参照关系”模式,R2称为“依赖关系”模式。
23. 关系模型的形式定义:
24. 关系查询语言根据其理论基础的不同分为哪两类:
关系代数语言:查询操作是以集合操作为基础运算的DML语言。(非过程性弱)
关系演算语言:查询操作是以谓词演算为基础运算的DML语言。(非过程性强)
25. 关系代数中的操作有哪些?
关系代数中的操作可分为两类:
传统的集合操作:并、差、交、笛卡尔积
扩充的集合操作:对关系进行垂直分割(投影)、水平分割(选择),关系的结合(联接、自然联接),笛卡尔积的逆运算(除法)等。
其中五个基本操作为:并、差、笛卡尔积、投影、选择。
四个常用组合操作为:交、连接、自然连接、除法
两种扩充的关系代数操作为:外连接和外部并
26. 关系演算有哪两种:
关系演算可分为元组关系演算和域关系演算。前者以元组为变量,后者以属性(域)为变量。
27. 什么是约束变量、自由变量:
如果元组变量未使用存在量词 或全称量词 符号定义,那么称为自由元组变量,否则称为约束元组变量。
约束变量类似于程序设计语言过程内部定义的局部变量,自由变量类似于过程外部定义的外部变量或全局变量。
28. 什么是安全运算:
在数据库技术中,不产生无限关系和无穷验证的运算称为安全运算,相应的表达式称为安全表达式,所采取的措施称为安全约束。
在关系演算中约定,运算只对表达式中公式在涉及到的关系的值范围内操作。这样就不会产生无限关系和无穷验证问题,关系演算是安全的。
29. 为什么要对关系代数表达式进行优化:
查询优化是由DBMS对关系代数表达式进行优化组合,以提高DBMS的系统效率。要对关系代数进行优化的原因是:由于关系代数表达式是由关系代数操作组合而成。在关系代数操作中,执行笛卡尔积和联接运算最费时间,并且在执行过程中将产生大量的中间结果,以使系统执行效率较低。在执行前,由DBMS查询处理子系统先对关系代数表达式进行优化,尽可能早地执行选择和投影操作,以得到较小的中间关系,减少运算量和读外存块的次数,节省系统的执行时间,提高执行效率。
30. 简述查询优化的优化策略:
(1) 在关系代数表达式中尽可能早地执行选择操作。
(2) 把笛卡尔积和随后的选择操作合并成F联接运算。
(3) 同时计算一连串的选择和投影操作,以免分开运算造成多次扫描文件,从而能节省操作时间。
(4) 如果在一个表达式中多次出现某个子表达式,应该将该子表达式预先计算出结果保存起来。以免重复计算。
(5) 适当的对关系文件进行预处理。
(6) 在计算表达式之前应先估计一下怎么计算合算。