admin管理员组

文章数量:1794759

数据库系统概论(知识整理)你值得拥有

数据库系统概论(知识整理)你值得拥有

数据库系统概论
  • 数据库系统概论
    • 第一章:
      • 1.数据库的四个基本概念
        • a.数据(data):
        • b.数据库(DataBase,DB):
        • c.数据库管理系统(DataBase Management System,DBMS):
          • 主要功能:
        • d.数据库系统(DateBase System DBS):
      • 数据库系统总结
        • 数据结构化:
        • 数据的共享性高,冗余度小,易扩展:
        • 数据独立性高:
        • 数据由数据库管理系统统一管理和控制:
          • 数据安全性保护:
          • 数据完整性检查:
          • 并发控制:
          • 数据库恢复:
      • 2.数据模型:
        • 数据模型组成要素:
        • 数据结构:
        • 数据操作:
        • 数据的完整性约束条件:
        • 概念模型:
          • 基本概念:
        • 逻辑模型和物理模型:
        • 常用的数据模型:
          • 数据库领域中主要的逻辑数据模型有:
          • 1.层次模型(树)
          • 层次模型的数据结构需要满足的条件:
          • 层次模型的数据操纵与完整性约束:
          • 层次模型的优缺点:
          • 2.网状模型:
          • 网状模型数据结构:
          • 网状模型的数据操纵与完整性约束:
          • 网状模型的优缺点:
          • 3.关系模型
          • 关系模型的数据结构:
          • 关系:
          • 元组:
          • 属性:
          • 码:
          • 域:
          • 分量:
          • 关系模式:
          • 对关系的描述
          • 关系模型的数据操纵与完整性约束:
          • 关系模型的优缺点:
      • 3.数据库系统的结构
        • 1.数据库系统模式的概念
      • DBMS的相同特征:
        • 数据库系统的三级模式结构:
        • 模式:
        • 外模式:
        • 内模式:
        • 总结:
        • 数据库的二级映像功能与数据独立性:
          • 二级映像:
          • 外模式/模式映像:
          • 模式/内模式映像:
          • 总结:
      • 4.数据库系统的组成
        • ①硬件平台及数据库
        • ②软件
        • ③人员

数据库系统概论 第一章: 1.数据库的四个基本概念 a.数据(data):

是数据库中存储的基本对象,例如:文本,视频,语音,图像等都属于数据

定义:描述事物的符号记录称为数据

数据的表现形式还不能完全表达其内容,需要经过解释,数据和关于数据的解释是不可分的,数据的含义(解释)称为数据的语义

即:数据与其语义是不可分的

b.数据库(DataBase,DB):

是存放数据的仓库(位于计算机上,数据以一定形式存储【二进制】)

定义:数据库是长期储存在计算机内、有组织、可共享到达大量数据的集合,数据库中的数据按照一定的数据模型组织、描述和存储,具有较小的冗余度,较高的独立性和易扩展性,并可为各种用户共享

特点(对于数据库中的数据):永久存储,有组织,可共享

c.数据库管理系统(DataBase Management System,DBMS):

是一个位于用户和操作系统之间的一层数据管理软件,与操作系统一样是计算机的基础软件

主要功能:

①数据定义功能

数据定义语言(DDL)对数据对象的组成与结构进行定义

②数据组织、存储和管理

提高数据库的效率

③数据操纵功能

数据操纵语言(DML)用户可以用其操纵数据,实现对数据库的基本操作——增,删,改,查

④数据库的事务管理和运行管理

由DBMS统一进行以保证数据的安全性,完整性,多用户并发使用及发生故障后的系统恢复

⑤数据库的建立和维护功能

包括初始数据的输入,转换功能,数据库的转储,恢复功能,数据库的重组织功能,性能监视,分析功能

⑥其他功能

包括数据库管理系统和网络中其他软件系统的通信功能,两个DBMS或文件系统的数据转换功能,异构数据库之间的互访和互操作功能

d.数据库系统(DateBase System DBS):

DBS由DB,DBMS,应用程序,DBA(数据库管理员)组成,是存储,管理,处理,维护数据的系统

数据库系统总结

处理方式:联机实时处理,分布处理,批处理

数据共享程度:共享性高,冗余度小

数据的独立性:具有高度物理独立性和一定的逻辑独立性

数据的结构化:整体结构化,用数据模型描述

数据控制能力:由DBMS提供数据安全性,完整性,并发控制,恢复能力

——————————————————————————————————————————————————————————

数据结构化:

数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别

整体结构化指数据库中的数据不再仅仅针对某一应用,而是面向整个组织或企业。数据内部、整体都是结构化的,数据之间是有联系的

数据的共享性高,冗余度小,易扩展:

数据面向整个系统,数据共享可大大减少数据冗余,节约存储空间,能够避免数据之间的不相容性与不一致性,也因面向整个系统使得数据库系统的弹性大,易于扩充

数据独立性高:

数据独立性包括:物理独立性和逻辑独立性

物理独立性:指用户的应用程序与数据库中数据的物理存储是相互独立的(用户无需了解数据在数据库系统的中存储方式)

逻辑独立性:指用户的应用程序与数据库中数据的逻辑结构是相互独立的

数据由数据库管理系统统一管理和控制:

数据库的共享势必带来各种隐患和问题

数据安全性保护:

保护数据以防止不合法使用造成的数据泄密和破坏

数据完整性检查:

数据的正确性、有效性、相容性

并发控制:

多用户同时存取,修改数据库时进行控制和协调

数据库恢复:

数据发生各种问题后让数据库从错误状态恢复到原正确状态

2.数据模型:

是对现实世界数据特征的抽象,用于描述数据,组织数据,对数据进行操作(DBS的核心和基础)

要求:能比较真实地模拟现实世界,容易为人所理解,便于在计算机上实现

模型分类:1.概念模型,2.逻辑模型和物理模型

数据模型组成要素:

数据模型是严格定义的一组概念的集合,精确描述了系统的静态特性,动态特性,完整性约束条件

所以数据结构,数据操作,数据的完整性约束条件组成数据模型

数据结构:

数据结构描述数据库的组成对象以及对象之间的联系

数据结构是所描述的对象类型的集合,是对系统静态特性的描述

数据操作:

数据操作是指对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作和有关的操作规则

数据操作是对系统动态特性的描述

数据的完整性约束条件:

是一组完整性规则(制约,依赖),来保证数据的正确,有效,相容

概念模型:

也称信模型,按照用户的观点对数据和信建模,主要用于数据库设计

是现实世界到机器世界的一个中间层次

特点:具有较强的语义表达能力,方便,直接地表达应用中的各种语义知识,简单,清晰,易于用户理解

基本概念:

1.实体:客观存在并可相互区别的事物称为实体

2.属性:实体所具有的特性

3.码:唯一标识实体的属性集称为码(主键)

4.实体型:用实体名及其属性名集合来抽象和刻画同类实体,称为实用体

like:

Student(20102040124,"zhangsan","man","20200801")

5.实体集:同类型实体的集合

6.联系:通常是不同实体集间的联系(1对1,1对多,多对多)

7.概念模型的一种表示方法:实体-联系方法(E-R方法)

逻辑模型和物理模型:

逻辑模型包括:层次模型,网状模型,关系模型,面向对象设数据模型,对象关系数据模型,半结构化数据模型,等。按照计算机系统的观点对数据建模,主要用于DBMS的实现

物理模型时对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,或在磁盘或磁带上的储存方式和存取方法,面向计算机系统。

常用的数据模型: 数据库领域中主要的逻辑数据模型有:
  • 层次模型
  • 网状模型
  • 关系模型
  • 面向对象数据模型
  • 对象关系数据模型
  • 半结构化数据模型
  • 层次化模型和网状模型统称格式化模型

    格式化模型中数据结构的单位是基本层次联系

    基本层次联系:指两个记录以及它们之间的一对多(包括一对一)的联系

    1.层次模型(树)

    层次数据库系统采用层次模型作为数据的组织方式,采用树状结构来表示各类实体以及实体间的联系

    层次模型的数据结构需要满足的条件:

    ①有且只有一个结点没有双亲结点,即根节点

    ②根以外的其他节点有且只有一个双亲结点

    层次模型的数据操纵与完整性约束:

    数据操纵上:增删改查(必须满足完整性约束)

    进行插入操作时:若没有相应的双亲结点值就不能插入它的子节点

    进行删除操作时:若删除父结点则子节点同时删除

    层次模型的优缺点:

    优点:

    ①数据结构比较简单清晰

    ②层次数据库查询效率高(优于关系数据库,不低于网状数据库)

    ③层次数据模型提供了良好的完整性支持

    缺点:

    ①现实生活中很多联系都是非层次的(多对多不适合层次)

    ②若一个结点有多个双亲结点,层次模型并不适合

    ③查询子女结点必须需要双亲结点

    ④由于结构严密,层次命令趋于程序化

    总结:层次模型对具有一对多的层次联系的部门描述非常自然、直观、容易理解。

    2.网状模型:

    适用于现实生活中事物之间的(非层次关系)联系

    典型代表:DBTG系统,也称为CODASYL系统

    网状模型数据结构:

    ①允许一个以上的结点无双亲

    ②一个结点可以有多个双亲

    总结:网状模型中子女结点与双亲结点联系不唯一

    网状模型的数据操纵与完整性约束:

    ①支持记录码的概念,码即唯一标识记录的数据项的集合

    ②保证一个联系中双亲记录和子女记录之间为一对多的联系

    ③支持双亲记录和子女记录之间的某些约束条件

    网状模型的优缺点:

    优点:

    ①能更加直接地描述现实世界,(一个结点可有多个或无子节点或双亲),结点有多种联系

    ②具有良好的性能,存取效率高

    缺点:

    ①结构比较复杂,随应用环境而扩大,不利于最终用户掌控

    ②网状模型的DDL、DML复杂,并且要嵌入一种高级语言中,用户难掌握和使用

    ③记录之间联系通过存取路径实现,应用程序在访问数据时必须选择适当的存取路径,了解系统结构的细节,编写应用程序的负担重

    3.关系模型

    最重要的数据模型

    关系模型的数据结构:

    与以往的模型不同,建立在严格的数学概念的基础上,由各种关系组成。每个关系的数据结构都是规范化的二维表。

    关系:

    规范化的表

    元组:

    表中的一行(对象)

    属性:

    表中的一列(对象的特性)

    码:

    表中的属性组(可以用来确定元组)(主键)(最特殊的属性组)

    域:

    某个属性组的取值范围

    分量:

    元组中的一个属性值

    关系模式: 对关系的描述 student(number,name,sex,class,majority)

    关系的每一个分量必须是不可再分的数据项(规范化)

    关系模型的数据操纵与完整性约束:

    完整性约束:实体完整性,参照完整性,用户定义的完整性

    关系模型中的数据操作是集合操作,操作对象和操作结果都是关系

    关系模型不会向用户显示存取路径,用户只要指出干什么不必管怎么干(面向对象)

    关系模型的优缺点:

    优点:

    ①关系模型与格式化模型不同,是建立在严格的数学概念基础上的

    ②关系模型的概念单一,数据结构简单,清晰,用户易懂,易用

    ③关系模型的存储路径对用户隐藏,有更高的数据独立性,更好的安全保密性,简化了程序员的工作和数据库开发工作

    缺点:

    存取路径对于用户是隐藏的,查询效率低,位提高性能,DBMS需要对用户的查询请求进行优化,增加了开发DBMS的难度

    3.数据库系统的结构 1.数据库系统模式的概念

    数据模型中有型和值的概念

    型:对某类数据的结构和属性的说明

    【student】(number,name,sex,class,majority)

    值:对应型的对象的个体属性

    (20201010,"zhangsan","难","计科1班","计算机")

    模式:数据库中全体数据的逻辑结构和特征的描述(仅涉及型)

    模式的实例:模式的一个具体值(同个模式可以有多个实例)

    模式是相对稳定的而实例是相对变动的

    DBMS的相同特征:

    采用三级模式,提供两级映像

    数据库系统的三级模式结构:

    分别为:外模式,模式,内模式

    模式:

    也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图(处于结构的中间层)

    不干涉数据的物理存储细节和硬件环境,与具体的应用程序、所用的应用开发工具及高级程序设计语言无关

    一个数据库只有一个模式

    以某种数据模型为基础,统一考虑所有用户的需求,并有机结合形成一个逻辑整体

    定义模式时不仅要定义数据的逻辑结构而且要定义数据之间的联系,定义与数据有关的安全性、完整性要求

    外模式:

    也称子模式或用户模式,是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据逻辑表示

    通常情况下外模式是模式的子集,一个数据库可以有多个外模式

    外模式是保证数据库安全性的一个有力措施,有个用户只能看见和访问其所对应的外模式中的数据,其余数据不可见

    内模式:

    也称存储模式,一个数据库只有一个内模式,是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式

    总结:

    三级模式是数据的三个抽象级别,把数据的具体组织留给DBMS来管理,使得用户可以有逻辑地、抽象地处理数据,而不必关心数据在计算机中具体表现形式(与面向对象概念相似)

    数据库的二级映像功能与数据独立性:

    二级映像能在系统内部实现三个抽象层次的联系和转换

    二级映像:
  • 外模式/模式映像
  • 模式/内模式映像
  • 两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性

    外模式/模式映像:

    模式描述是数据的全局逻辑结构,外模式描述的是数据的局部逻辑结构

    同一个模式可以有任意多个外模式,每个外模式DBS都有一个外模式/模式

    当模式改变时,由DBA对各个外模式/模式映像作相应改变,可以使外模式保持不变

    应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性

    模式/内模式映像:

    数据库中只有一个模式,也只有一个内模式,所以模式/内模式映像是唯一的。

    定义了数据全局逻辑结构与存储结构之间的对应关系

    当数据库的存储结构改变时,由DBA对模式/内模式映像作相应改变,可以使模式保持不变,从而应用程序不必改变,保证了数据与程序的物理独立性

    总结:

    全局逻辑结构(数据库模式)是数据库中心与关键,独立于数据库的其他层次

    内模式依赖于全局逻辑结构,独立于外模式&&存储设备

    数据与程序之间的独立性使得数据的定义和描述可以从应用程序中分离出去,由于数据的存取由DBMS管理,简化了应用程序的编制,大大减少了应用程序的维护和修改

    4.数据库系统的组成 ①硬件平台及数据库

    要求:

  • 有足够大的内存,存放操作系统,数据库管理系统的核心模块,数据缓冲区和应用程序
  • 有足够大的磁盘,磁带
  • 系统有较高的通道能力以提高数据传送率
  • ②软件
  • DBMS
  • 支持的操作系统
  • 具有数据库接口的高级语言
  • 以DBMS为核心的应用开发工具
  • 为特定应用环境开发的数据库应用系统
  • ③人员
  • DBA
  • 系统分析员和数据库设计人员
  • 应用程序员
  • 用户
  • 本文标签: 概论知识数据库系统