关于关系数据库模式分解与范式的总结_怎么分解关系范式
关于关系数据库模式分解与范式的总结由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“怎么分解关系范式”。
1.关系模式设计不规范会带来一系列的问题 数据冗余 更新异常 插入异常 删除异常
因此需要一个标准的模式来解决这些问题,引入模式分解来解决存在问题。
2.无损连接的概念比较好懂,就是要保证模式分解后仍然可以根据分解后的关系回退回分解前。这可以保证分解过程没有丢失信息,不会破坏和更改已经存在的。而检验无损连接的方法分为两种:
①当R分解为两个关系模式R1和R2时,有一种简便的方法可以测试无损连接性 p={R1,R2} p是无损连接的分解当且仅当下面之一满足(R1 ∩ R2)→(R1-R2)(R1 ∩ R2)→(R2-R1)
其中R1 ∩ R2指模式的交,返回公共属性
R2-R1表示模式的差集,返回属于R2但不属于R1的属性集
也可以理解为R1∩R2的结果是R的超码,即该结果可以推出全部R属性。②当R分解为多个关系模式时,可以使用chase算法:
R(A,B,C,D,E)R1(A,D), R2(A,B), R3(B,E), R4(C,D,E), R5(A,E)F={A→C, B→C, C→D, DE→C, CE→A} 判断R分解为p={R1,R2,R3,R4,R5}是否是无损连接的分解? 第一步,构造初始表。
A→C:将b23,b53改为b13 B→C:将b33改为b13 C→D:将b24,b34,b54改为a4 DE→C:将第3行和第5行的C改为a3 CE→A:将第3行和第4行的A改为a1 处理后BE行将全变为a,证明为无损连接。
3.函数依赖(FD)的表现形式是x→y,可以根据函数的概念理解,当x属性的值相同时,可以断定y也一定相同。在实际关系模式中,x与y会存在逻辑上的相关性,如一个学号会对应一个姓名。要理解函数依赖是关系模式的内涵,保持函数依赖才能保持关系模式中存在的关系。举个栗子:
R(city, street, zip), F={(city,street)→zip, zip→city} 分解为p={R1(street,zip),R2(city,zip)} 在R1中插入(’a’,’100081’)和(’a’,’100082’)R2中插入(’Beijing’,’100081’)和(’Beijing’,’100082’)R1∞R2:得到
(city,street)→zip,因为它被丢失了,语义完整性被破坏。
4.范式是满足特定要求的模式,也就是我们追求的标准。使关系模式符合某种范式可以容易验证其合理性并解决或规避最开始提及的那些问题。
1NF:对于关系模式R的任一实例,其元组的每一个属性值都只含有一个值,则R符合1NF。1NF是关系的基本要求。R不满足1NF会带来更新时的二义性。
2NF:(假定R只有一个候选码,且该候选码为主码)当且仅当R属于1NF,且R的每一个非主属性都完全函数依赖于主码时,R 符合2NF。(完全函数依赖:对于函数依赖W→A,若不存在X∈W,并且X→A成立,则称W→A为完全函数依赖,否则为局部函数依赖。即非主属性只能由全部主码推出,不能由部分主码推出。)
3NF:(假定R只有一个候选码,且该候选码为主码)当且仅当R属于2NF,且R的每一个非主属性都不传递依赖于主码时,R 符合3NF。(传递依赖:若Y→X,X→A,并且X→Y,A不是X的子集,则称A传递依赖于Y)
BCNF:如果关系模式R的所有不平凡的、完全的函数依赖的决定因素(左边的属性集)都是候选码,则R符合BCNF。(用于解决存在多组候选码的情况)介绍几个模式分解的算法。保持函数依赖分解到3NF的算法: 求出R的最小函数依赖集(仍记为F)
把所有不在F中出现的属性组成一个关系模式R’,并在U中去掉这些属性(剩余属性仍记为U)若F中存在X →A,且XA=U, 则输出R(U)和R’,算法结束,否则
对F按相同的左部分组,将所有X →A1, X →A2,…, X →Ak形式的FD分为一组,并将每组涉及的所有属性作为一个关系模式输出。若某个关系模式Ri的属性集是另一个关系模式的属性集的子集,则在结果中去掉Ri。设最后得到关系模式R1,R2,…,Rk,则p={R1,R2,…,Rk,R’}一个保持函数依赖的分解,并且满足3NF。举个栗子:
R(ABCDEF), F={A→B,AC→E} 求最小FD集F={A→B,AC→E} R’(DF)按左部分组: R1(AB), R2(ACE)p={R’(DF), R1(AB), R2(ACE)} 保持函数依赖和无损连接分解到3NF的算法:
首先用算法1求出R的保持函数依赖的3NF分解,设为q={R1,R2,…,Rk} 设X是R的主码,求出p=q {R(X)} 若X是q中某个Ri的子集,则在p中去掉R(X)得到的p就是最终结果 举个例子: R(S#,SN,P,C,S,Z), F={S#→SN,S#→P,S#→C,S#→S ,S#→Z,{P,C,S}→Z, Z→P,Z→C}? 求出最小FD集:F={S# →SN, S# →P,S# →C, S#→S, {P,C,S} →Z, Z →P,Z →C} // S# →Z冗余
q={R1(S#,SN,P,C,S), R2(P,C,S,Z), R3(Z,P,C)} R3是R2的子集,所以去掉R3 q={R1(S#,SN,P,C,S), R2(P,C,S,Z)} R的主码为S#,于是
p=q U {R(X)}={R1(S#,SN,P,C,S), R2(P,C,S,Z), R(S#)} 因为{S#}是R1的子集,所以从p中去掉R(S#)p ={R1(S#,SN,P,C,S), R2(P,C,S,Z)}即最终结果.无损连接分解为BCNF算法: 输入:R;输出:p p:={R};检查p中各关系模式是否都属于BCNF,若是,则算法终止
设p中S(Us)非BCNF关系模式,则必存在X→A,其中X不是S的超码;
将S分解为S1(XA)和S2(Us-A),此分解是无损联接的; //({XA}{Us-A}=X)→(A={XA}-{Us-A})p:={p-S} {S1, S2};//用S1和S2替换p中的S 转到第2步;
由于U的属性有限,因此有限次循环后算法终止。举个例子: R(S#,C#,G,TN,D), F={{S#,C#} →G, C#→TN, TN→D} p:={R};TN→D不满足BCNF定义,分解R p:={R1(S#,C#,G,TN), R2(TN,D)} R1中C#→TN不满足BCNF,分解R1为R3和R4 p:={R3(S#,C#,G), R4(C#,TN), R2(TN,D)} p中各模式均满足BCNF,结束
5.总结所学范式要知道,范式存在是用来解决数据冗余,更新异常,插入异常,删除异常这些实际问题的。在具体的情况中,有些时候我们并不介意数据冗余的问题,范式自然也就不是越严苛越好。关于多值依赖和4NF范式没有继续总结。在具体关系数据库设计时需要灵活运用。