6、 6、(1)R∞S∞T A B C D 2 3 5 6 1 6 8 3 5 3 5 6 2 6 8 3 (2)R∝S A B 2 3 1 6 5 3 2 6 S∝R B C 3 5 3 5 6 8 S ∝T B C 3 5 6 8 5 9 4 1 T∝R 为空 R∝T 为空 T∝S D E 6 6 3 8 7、
解:假设每个属性域长度均为1B,考虑所有的半连接
E 6 8 6 8 C 5 8 5 8 D 6 9 3 D 6 3 6 6 I 9 9 9 9 I 9 9
a) 选择得益最高的P2进行优化,得到新的R,S’,T,并对受到影响的的方案重新计算得益和费用。
新的R, S’, T如下:
对受到影响的的方案重新计算得益和费用
b) 选择得益最高的P4进行优化,得到新的R,S’,T’,并对受到影响的方案重新计算得益和费用。 新的R, S’, T’如下:
对受到影响的的方案重新计算得益和费用
c) 选择得益最高的P1进行优化,得到新的R’,S’,T’,并对受到影响的方案重新计算得益和费用。 新的R’, S’, T’如下:
对受到影响的的方案重新计算得益和费用
d) 选择得益最高的P3进行优化,得到X,Y,Z站点上最终的R’,S’’,T’。 X,Y,Z站点上最终的R’,S’’,T’如下:
所以选择各站点做连接的代价为: X站点代价=2*3+2*3=12 Y站点代价=4*3+2*3=18 Z站点代价=4*3+2*3=18
故选择X站点作为收集站点代价最低。
由简化过程得知半连接过程为:
1. S’ = S∝R
2. 将S’传送给T,做半连接T∝S’得到T’ 3. 将S’传送给R,做半连接R∝S’得到R’ 4. 将T’传送给S’,做半连接S’∝T’得到S’’
即:
(R∝(S∝R))∞((S∝R) ∝(T∝(S∝R))∞(T∝(S∝R))
8、
1)将New York站点上的副本传至Toronto站点;
2)在New York站点上求平均工资,传至Toronto站点;
3)Toronto, Edmonton, Vancouver, Montreal求最高工资,传至Toronto汇总;
10、(1)提出查询的站点:(1)Aromonk站点,plant-number=X的站点;(2)Aromonk站点,plant-number=Xi的站点;(3)各工厂站点
(2)需要结果的站点:(1)plant-number=X的站点,Aromonk站点;(2)plant-number=Xi的站点,Aromonk站点;(3)Aromonk站点
4.1 概述分布式数据库系统中事务的定义、特性、结构和状态,以及分布式事务所特有的性质。 分布式数据库系统中的事务是一个分布式操作的序列,被操作的数据分布在不同的站点上,所以称为分布式事务。
分布式数据库系统中的事务具有事务的ACID四个特性,即原子性、一致性、隔离性和耐久性。 分布式数据库系统中事务的结构以begin transaction原语作为一个事务的开始,以commit原语作为一个事务成功完成的结束,而以rollback或abort原语作为事务失败的结束。 分布式数据库系统中的事务状态(这点找不到??)
分布式事务所特有的性质有大量的数据传递、通信原语和控制报文等。
4.2 请用自己的语言描述分布式事务管理的抽象模型和分布式事务执行的控制模型。
4.3 分布式数据库系统中的事务管理与集中式数据库系统中的事务管理有何不同? 分布式与集中式相比,会多遇到一些问题:(1)处理数据项的多个副本;(2)单个站点的故障;(3)通信网络的故障;(4)分布式提交。
4.4 什么是事务的提交点?为什么说它们很重要? 当事务所有的站点数据库存取操作都已成功执行,并且所有操作对数据库的影响都已记录在日志中时,该事务就到达提交点。
(为什么说它们很重要?这点找不到??)
4.5 日志、档案库和检查点的作用是什么?典型的日志包含哪些内容?为什么要“先写日志”? 日志的作用是为了能够从故障状态中恢复有影响的事务。 档案库的作用是为了防止因介质故障而破坏日志和数据库。 检查点的作用是为了便于恢复事务。
典型的日志包含了每个改变数据项值的写操作记录。
因为系统崩溃时主存中的内容可能丢失,所以恢复时只能考虑已写回磁盘的日志内容。因此,在事务到达提交点以前,还未写到磁盘的日志的任何部分,必须被写入磁盘,即“先写日志”。
4.6 列出分布式数据库系统中可能出现故障类型。哪些故障也可能出现在集中式数据库系统中?
事务故障、系统故障、介质故障、站点故障、通信故障。
事务故障、系统故障、介质故障也可能出现在集中式数据库系统中。
4.7 请用自己的语言描述两阶段提交过程。
4.8 为什么说两阶段提交协议在不丢失运行日志信息的情况下,可从任何故障恢复? 因为在执行过程中维护了事务日志,记录了执行恢复所需要的信息。
4.9 在分布式数据库系统中对多副本数据的更新通常采用什么方法?快照方法的优点和缺点是什么?
主文本更新法、快照方法。
快照方法的优点:既避免了某些并发空控制的开销,又便于复杂查询的完成,是提高系统可用性的有效方法。
缺点:快照只是一个只读关系,其中数据只能读而不能写。
4.10 为什么说分布式事务增强了数据库的一致性?
第五章
5.1 为什么说分布式数据并发控制比集中并发控制要复杂得多?
P131 第二段 分布式数据库中。。。。要复杂得多。
5.2 描述分布式事务的可串行化理论的一些定义:事务、冲突操作、并发调度、串行调度、一致性调度、两个调度等价、可串行化调度。
相关推荐: