深入理解数据库并发控制原理
并发控制原理
事务之间的相互影响可能导致数据库状态的不一致,即使各个事务能保持状态的正确性,而且也没有任何故障发生。因此,不同事务中各个步骤的执行顺序必须以某种方式进行规范。控制这些步骤的功能由DBMS的调度器部件完成,而保证并发执行的事务能保持一致性的整个过程称为并发控制。调度器的作用如图1所示。
首先讨论如何保证并发执行的事务能保持数据库状态的正确性。抽象的要求称为可串行性,另外还有一个更强的、重要的条件为冲突可串行性,它是大多数调度器所真正实现的。我们考虑实现调度器的最重要技术:封锁、时间戳和有效性确认。
1.串行调度和可串行化调度
1.1 调度
调度是一个或多个事务的重要操作按时间排序的一个序列。
例1 考虑两个事务以及它们的动作按照某些顺序执行时的数据库的影响。T1和T2的重要动作如表1所示。
表1 两个事务
T1
|
T2
|
READ(A,t)
|
READ(A,s)
|
t := t + 100
|
s := s*2
|
WRITE(A,t)
|
WRITE(A,s)
|
READ(B,t)
|
READ(B,s)
|
t := t + 100
|
s := s*2
|
WRTIE(B,t)
|
WRITE(B,s)
|
1.2 串行调度
如果一个调度的动作首先是一个事务的所有动作,然后是另一个事务的所有动作,以此类推,而没有动作的混合,那么我们说这一调度是串行的。
例2 对表1中的事务而言,两个串口调度,一个是T1在T2前,而另一个是T2是T1之前,初态为A=B=25。
表2T1在T2前的串行调度
T1
|
T2
|
A
|
B
|
25
|
25
|
||
READ(A,t)
|
|||
t := t + 100
|
|||
WRITE(A,t)
|
125
|
||
READ(B,t)
|
|||
t := t + 100
|
|||
WRTIE(B,t)
|
125
|
||
READ(A,s)
|
|||
s := s*2
|
|||
WRITE(A,s)
|
250
|
||
READ(B,s)
|
|||
s := s*2
|
|||
WRITE(B,s)
|
250
|
表3 T2在T1前的串行调度
T1
|
T2
|
A
|
B
|
25
|
25
|
||
READ(A,t)
|
|||
t := t + 100
|
|||
WRITE(A,t)
|
50
|
||
READ(B,t)
|
|||
t := t + 100
|
|||
WRTIE(B,t)
|
50
|
||
READ(A,s)
|
|||
s := s*2
|
|||
WRITE(A,s)
|
150
|
||
READ(B,s)
|
|||
s := s*2
|
|||
WRITE(B,s)
|
150
|
1.3 可串行化调度
事务的正确性原则告诉我们,每个串行调度都将保持数据库状态的一致性。
通常,不管数据库初态怎样,一个调度对数据库状态的影响都和某个串行调度相同,我们就说这个调度是可串行化的。
例3 表4是例1中事务的一个调度,此调度是可串行化的,但不是串行的。表5不是可串行化的。
表5 一个非串行的可串行化调度
T1
|
T2
|
A
|
B
|
25
|
25
|
||
READ(A,t)
|
|||
t := t + 100
|
|||
WRITE(A,t)
|
125
|
||
READ(A,s)
|
|||
s := s*2
|
|||
WRITE(A,s)
|
250
|
||
READ(B,t)
|
|||
t := t + 100
|
|||
WRTIE(B,t)
|
125
|
||
READ(B,s)
|
|||
s := s*2
|
|||
WRITE(B,s)
|
250
|
表6 一个非可串行化的调度
T1
|
T2
|
A
|
B
|
25
|
25
|
||
READ(A,t)
|
|||
t := t + 100
|
|||
WRITE(A,t)
|
125
|
||
READ(A,s)
|
|||
s := s*2
|
|||
WRITE(A,s)
|
250
|
||
READ(B,s)
|