概念---数据库1:常用概念汇总

域、笛卡尔积、关系、元组、属性

  • 是一组具有相同数据类型的值的集合,比如整数,浮点数,无理数。或者{小明,小红,小丽,…}
  • 笛卡尔积为域和域之间的运算,就是,遍历两个集合所有的可能组合。D1×D2={(x,y)}D_1 \times D_2=\{(x,y)\}

主码、候选码、外码

  • 候选码是一个属性组,这个属性组能够唯一地标识一个元组(比如说居民身份证在国内唯一的标识了某一个确定的人),而其子集不能。
  • 一个关系如果有多个候选码,选定一个作为主码,候选码的各个属性成为主属性
  • F是R的外码,如果F满足:
    F是R的一个或者一组属性,且F不是R的主码;
    Ks是关系S的主码,而F与Ks相对应

比如,学生关系中的所选择的专业号这一属性,这与专业关系中的专业的专业号可以形成一一对应,那么这时我们称专业号是学生关系中的外码。并且,称学生关系为参照关系,专业关系为被参照关系
注:外码可以为空,该例中表示未给学生分配专业。

关系模式,关系,关系数据库

  • 关系,在用户看来,就是一张扁平的二维表。专业术语叫它:只包含单一的数据结构——关系

  • 关系模式就是关系的描述,R(U,D,DOM,F)R(U,D,DOM,F),包括:

  1. UU表示该关系的属性名集合,比如学生名,学号,…
  2. DD表示属性中数据来自的域,比如字符串,数字串,…
  3. DOMDOM为属性向域的映像集合,比如规定学生名中只能映射到{小明,小红,…}
  4. FF为属性间的依赖关系,比如小红的学号是2015053078,而不是2015053071
  • 关系数据库就是在一个给定的应用领域中,所有关系的集合。比如校园网系统,关系数据库就是包括学生学号关系,专业课关系,选课关系,课程老师关系,学生老师关系,…等等关系的集合

关系模型的完整性规则

  • 实体完整性
    主属性不能包含有空

  • 参照完整性
    外码可以为空,但是外码的取值范围一定是在被参照关系所对应属性中的取值。

比如,学生关系,其中的专业号引用了专业关系中的专业号,这时,学生关系中的专业号属性可以为空,表示暂时没有给这个学生分配专业,但是这个专业号不能是专业关系中不存在的专业号。

  • 用户定义的完整性
    就是说,为了满足用户的需求,我们额外给关系加上的约束条件就是用户定义完整性

比如,学生的成绩在0-100之间

关系运算

选择

σF(t)(R)\sigma_{F(t)}(R)
表示在RR关系中,使得F(t)=trueF(t)=true的所有tt的集合,比如
σname=""()\sigma_{name="林俊杰"}(小明的盆友们)就是表示从小明的盆友们这个关系中选择出所有叫做林俊杰的个体出来。如果我们把关系理解成为一个表格的话,那么我们可以理解为这个式子的结果就是一行一行的数据,有几个人叫“林俊杰”,我们就有几行

投影

ΠA(R)={t[A]tR}\Pi_{A}(R)=\{t[A]|t\in R\}
比如说,Πname,gender()\Pi_{name, gender}(小明的盆友们)就表示输出两列,一列是小明的所有盆友的名字,另一列是所有盆友的性别。

连接

RAθBS={trts^trRtsStr[A]θts[B]}R\Join_{A \theta B} S = \{\widehat{t_r t_s}|t_r\in R \wedge t_s\in S \wedge t_r[A]\theta t_s[B]\}
其中A,BA, B是属性,大概的人意思就是对于关系RRSS来说,只要有一部分的数据满足AA这些属性与BB这些属性有θ\theta的关系,那么我们就把他们取出来,然后连接在一起。

比如RR中的属性有name,student idname, student\ idSS中的属性有student id,course namestudent\ id, course\ name,那么我们这时候使用连接技能:
Rstudent id=student idSR \Join_{student\ id = student\ id} S就是表示,如果RR的某些行和SS中的某些行的student idstudent\ id相同的话,我们就把他们连接在一起,并且作为连接的输出。

像集

有一个关系R(X,Z)R(X, Z)其中XXZZ是属性,那么
ZxZ_x表示{t[Z]tR,t[X]=x}\{t[Z]|t\in R, t[X]=x\},就是从中找到满足t[X]=xt[X]=x的那些行,然后求它们所对应的t[Z]t[Z]

终于说到的真正想说的运算了,有点小复杂。

R÷S={tr[X]trRΠY(S)Yx,x=tr[X]}R\div S=\{t_r[X]|t_r\in R \wedge \Pi_Y(S)\subseteq Y_x, x=t_r[X]\} ={xtrRΠY(S)Yx}=\{x|t_r\in R \wedge \Pi_Y(S)\subseteq Y_x\}这里我们还是选择举个栗子来说明吧。
在这里,XX属性在这里为AAYY属性在这里为B,CB,C,所以xx可能的取值为{a1,a2,a3,a4}\{a_1,a_2,a_3,a_4\}; 所以YxY_x的所有可能取值为Yx=a1={(b1,c2),(b2,c3),(b2,c1)}Y_{x=a_1}=\{(b_1,c2),(b2,c3),(b_2,c_1)\}或者Yx=a2{(b3,c7),(b2,c3)}Y_{x=a_2}\{(b_3,c_7),(b_2,c_3)\}Yx=a3={(b4,c6)}Y_{x=a_3}=\{(b_4,c_6)\}或者Yx=a4={(b6,c6)}Y_{x=a_4}=\{(b_6,c_6)\}
ΠY(S)=ΠY(B,C)={(b1,c2),(b2,c1),(b2,c3)}\Pi_{Y}(S)=\Pi_{Y}(B,C)=\{(b_1,c_2),(b_2,c_1),(b_2,c_3)\},不难观察出使得ΠY(S)Yx\Pi_Y(S)\subseteq Y_xxx只有a1a_1,所以结果就是a1a_1啦!
概念---数据库1:常用概念汇总