admin管理员组

文章数量:1794759

数据库系统

数据库系统

内容来自2021春季学期《数据库系统》课程的PPT

SQL概述

SQL(Structured Query Language)——结构化查询语言,是关系数据库的标准语言;是一个通用的、功能极强的关系数据库语言

SQL的特点

  1. 综合统一:
    1. 集数据定义语言(DDL),数据操纵语言(DML),数据控制语言(DCL)功能于一体
    2. 可以独立完成数据库生命周期中的全部活动:
      1. 定义和修改、删除关系模式,定义和删除视图,插入数据,建立数据库
      2. 对数据库中的数据进行查询和更新
      3. 数据库重构和维护
      4. 数据库安全性、完整性控制,以及事务控制
      5. 嵌入式SQL和动态SQL定义
    3. 用户数据库投入运行后,可根据需要随时逐步修改模式,不影响数据库的运行
    4. 数据操作符统一
  2. 高度非过程化:
    1. 非关系数据模型的数据操纵语言"面向过程",必须指定存取路径;SQL无需了解存取路径
    2. 存取路径的选择以及SQL的操作过程由系统自动完成
  3. 面向集合的操作方式
    1. 非关系数据模型采用面向记录的操作方式,操作对象是一条记录
    2. SQL的操作对象、查找结果可以是元组的集合
    3. SQL一次插入、删除、更新操作的对象可以是元组的集合
  4. 以同一种语法结构提供多种使用方式
    1. SQL是独立的语言——能够独立地用于联机交互的使用方式
    2. SQL是嵌入式语言——能够嵌入到高级语言程序中,供程序员设计程序时使用
  5. 语言简洁,易学易用
    1. SQL功能极强,完成核心功能只用了9个动词
    2. SQL的动词
      1. 数据查询
        1. SELECT——选择
      2. 数据定义
        1. CREATE——创建
        2. DROP——删除
        3. ALTER——改变
      3. 数据操纵
        1. INSERT——插入
        2. UPDATE——更新/修改
        3. DELETE——删除
      4. 数据控制
        1. GRANT——授予权限
        2. REVOKE——取消权限

SQL的基本概念

  • 基本表
    • 本身独立存在的表
    • SQL中一个关系对应一个基本表
    • 一个(或多个)基本表对应一个存储文件
    • 一个表可以带若干索引
  • 存储文件
    • 逻辑结构组成了关系数据库的内模式
    • 物理结构对用户是隐蔽的
  • 视图
    • 从一个或几个基本表导出的表
    • 数据库中只存放视图的定义而不存放视图对应的数据
    • 视图是一个虚表
    • 用户可以在视图上再定义视图

学生-课程数据库

  • 学生-课程模式 S-T:

    • 学生表:Student(Sno, Sname, Ssex, Sage, Sdept)
    • 课程表:Course(Cno, Cname, Cpno, Ccredit)
    • 学生选课表:SC(Sno, Cno, Grade)
  • 学生表——Student(Sno, Sname, Ssex, Sage, Sdept)

学号 Sno姓名 Sname性别 Ssex年龄 Sage所在系 Sdept
200215121李勇20CS
200215122刘晨19IS
200215123王敏18MA
200215125张立19IS
  • 课程表——Course(Cno, Cname, Cpno, Ccredit)
课程号 Cno课程名 Cname先行课 Cpno学分 Ccredit
1数据库54
2数学2
3信息系统14
4操作系统63
5数据结构74
6数据处理2
7C语言64
  • 学生选课表——SC(Sno, Cno, Grade)
学号 Sno课程号 Cno成绩 Grade
200215121192
200215121285
200215121388
200215122290
200215122380

数据定义

  • SQL的数据定义功能:
    • 模式定义
    • 表定义
    • 视图和索引定义

SQL的数据定义语句

操作对象创建删除修改
模式CREATE SCHEMADROP SCHEMA
CREATE TABLEDROP TABLEALTER TABLE
视图CREATE VIEWDROP VIEW
索引CREATE INDEXDROP INDEXALTER INDEX
  • 现代关系DBMS提供了一个层次化的数据库对象命名机制
    • 一个关系DBMS的实例(Instance)中可以建立多个数据库
    • 一个数据库中可以建立多个模式
    • 一个模式通常包含多个表、视图和索引等数据库对象

数据库(有的系统称为目录)---->模式---->表以及视图、索引等

模式的定义与删除

定义模式

模式——命名空间:定义模式实际上定义了一个命名空间;在这个空间中可以定义该模式包含的数据库对象,例如基本表、视图、索引等

CREATE SCHEMA <模式名> AUTHORIZATION <用户名> [ <表定义子句> | <视图定义子句> | <授权定义子句> ]

定义模式举例:

1. 为用户WANG定义一个学生-课程模式S-T:
CREATE SCHEMA "S-T" AUTHORIZATION WANG;
2. 语句未指定<模式名>时,<模式名>隐含为<用户名>:
CREATE SCHEMA AUTHORIZATION WANG;
可以理解为:为用户WANG创建了一个模式WANG
3. 为用户ZHANG创建一个模式TEST,并在其中定义一个表TAB1:
CREATE SCHEMA TEST AUTHORIZATION ZHANG;
CREATE TABLE TAB1 (COL1 SMALLINT,COL2 INT,COL3 CHAR(20),COL4 NUMERIC(10, 3),COL5 DECIMAL(5, 2)
);

删除模式

DROP SCHEMA <模式名> < CASCADE | RESTRICT >
  • CASCADE(级联)——删除模式的同时把该模式中所有的数据对象全部删除
  • RESTRICT(限制)——仅当该模式中没有任何下属的对象时才能执行
    • 如果该模式中定义了下属的数据库对象(如表、视图等),则拒绝该删除语句的执行
1. 有一个模式ZHANG,其中定义了一个表TAB1,删除模式ZHANG并删除其中定义的表
DROP SCHEMA ZHANG CASCADE

基本表的定义、删除与修改

定义基本表

CREATE TABLE <表名> (<列名> <数据类型> [ <列级完整性约束条件> ][, <列名> <数据类型> [ <列级完整性约束条件> ]]……[, <表级完整性约束条件> ]
);
  1. <表名>:所要定义的基本表的名字
  2. <列名>:组成该表的各个属性(列)
  3. <列级完整性约束条件>:涉及相应属性列的完整性约束条件
  4. <表级完整性约束条件>:涉及一个或多个属性列的完整性约束条件
    • 如果完整性约束条件涉及到该表的多个属性列,则必须定义在表级上,否则既可以定义在列级也可以定义在表级
1. 建立"学生"表Student。学号是主码,姓名取值唯一
CREATE TABLE Student(Sno CHAR(9) PRIMARY KEY,  /* 列级完整性约束条件,Sno是主码 */Sname CHAR(20) UNIQUE,    /* Sname取唯一值,约束 */Ssex SMALLINT,Sdept CHAR(20)
);
2. 建立一个"课程"表Course
CREATE TABLE Course(Cno CHAR(4) PRIMARY KEY,Cname CHAR(40),Cpno CHAR(4),Ccredit SMALLINT,/* Cpno是外码,被参照表是Course,被参照列是Cno */FOREIGN KEY (Cpno) REFERENCES Course(Cno)
);
3. 建立一个学生选课表SC
CREATE TABLE SC(Sno CHAR(9),Cno CHAR(4),Grade SMALLINT,/* 表级完整性约束条件,Sno和Cno都是主码(两个及以上主码不可以用列级) */PRIMARY KEY(Sno, Cno),/* 表级完整性约束条件,Sno是外码,被参照表是Student */FOREIGN KEY (Sno) REFERENCES Student(Sno),/* 表级完整性约束条件,Cno是外码,被参照表是Course */FOREIGN KEY (Cno) REFERENCES Course(Cno)
);

数据类型

数据类型:SQL中域的概念通过数据类型来实现

定义表的属性时需要指明其数据类型及长度;选用哪种数据类型需要考虑两点:取值范围、要做哪些运算

数据类型含义
CHAR(n)长度为n的定长字符串
VARCHAR(n)最大长度为n的变长字符串
INT长整数(也可以写作INTEGER
SMALLINT短整数
NUMERIC(p, d**)**定点数,由p位数字(不包括符号、小数点)组成,小数后面有d位数字
REAL取决于机器精度的浮点数
Double Precision取决于机器精度的双精度浮点数
FLOAT(n)浮点数,精度至少为n位数字
DATE日期,包含年、月、日,格式为****YYYY-MM-DD
TIME时间,包含一日的时、分、秒,格式为****HH:MM:SS
数值类型
数据类型描述存储大小
Bit值为1,0,null的整数数据,不包含索引1字节
tinyInt0-255整数数据1字节
smallInt-2的15次方到2的15次方的整数数据2字节
int-2的31次方到2的31次方的整数数据4字节
bigint8字节的整数数据8字节
Binary[n]N字节的固定长度的二进制数据,n是介于1-8000之间的一个值。当一列的数据输入差别很小时,请使用binaryN+2字节
Varbinary[n]N字节的可变长度的二进制数据,n是介于1-8000之间的一个值。当一列的数据输入差别很大时,请使用VarbinaryN+2,可以为0
Varbinary(max)2005新类型,最大 2g,变长N+2,可以为0
Decimal[p,[s]]固定精度和刻度的数字。精度§指被保存数字的总位数,刻度(s)指定数字的小数点后面的位数。5-17字节
Numeric[p,[s]]Decimal的同义词
Real4字节的浮点精度数字数据4字节
Float[(n)]-1.79e+308至-2.23e-308.0以及2.23e-308至1.79e+308取决于n的值
Money货币数据。8字节,精确到货币单位的万分之一。8字节
Smallmoney货币数据。介于-213748.3648到213748.36474字节
字符类型
数据类型描述存储大小
Char[(n)]固定长度,非unicode字符数据,长度为n个字节。N的取值范围为1-8000n字节
Varchar[(n)]可变长度,非unicode字符数据。1-8000n字节
Nchar[(n)]N个字符固定长度unicode编码。N值必须指定在1-4000之间2乘n字节+2字节
Nvarchar[(n)]可变长度unicode字符数据。N值在1-4000之间2乘n字节+2字节
文本和图像类型
数据类型描述存储大小
text服务器代码页中长度可变的非Unicode数据,最大长度为2的31次方-1个字符。双字符和单字符都占1。2的31次方-1
ntext可变长度, unicode字符数据。2的30次方-12的30次方-1
imageUnicode, 2的31次方-12的31次方-1
日期和时间类型
数据类型描述存储大小
smalldatetime1900-1-1到2079-6-6,精度为分钟两个2字节的整数
datetime1753-1-1到9999-12-31,精度为1/300秒两个4字节
timestamp公开数据库中自动生成的一个唯一一个二进制的数据类型。通常用作给表行加班本戳的机制。一个表只能由一个该类型字段。8字节
其他数据类型
数据类型描述存储大小
sysname由特殊系统提供的,sqlserver用户定义的数据类型,sqlserver将sysname类型定义为nvarchar(128),可以存储128个unicode字符。256字节
xml2005新增类型,存储xml文件Xml格式<2gb
Uniqueidentifie全局唯一标识符(guid)。可以通过newid()函数产生。16字节
Sql_variable用于存储sqlserver2005支持的各种数据类型。除text,ntext,image,timestamp,sql_variant最大长度可以使8016字节

模式和表

  • 模式与表的关系:(一对多)

    • 一个模式包含多个基本表
    • 一个基本表属于一个模式
  • 定义基本表所属模式:

    • 方法一:在表名中明显地给出模式名
    • 方法二:在创建模式语句中同时创建表
    • 方法三:设置所属的模式
在表名中明显地给出模式名:
CREATE TABLE "S-T".Student(……); /* 模式名是S-T */
CREATE TABLE "S-T".Course(……);
CREATE TABLE "S-T".SC(……);

创建基本表(其他数据库对象也一样)时,若没有指定模式,系统会根据搜索路径来确定该对象所属的模式;关系DBMS会使用模式列表中第一个存在的模式来作为数据库对象的模式名;若搜索路径中的模式名都不存在,系统将给出错误

SHOW search_path  /* 显示当前的搜索路径 */
$user, PUBLIC     /* 搜索路径的当前默认值 */
数据库管理员用户可以设置搜索路径,然后定义基本表
SET search_path TO "S-T", PUBLIC;
CREATE TEABLE Student(……);
/* 建立个S-T.Student基本表 */
关系DBMS发现搜索路径中第一个模式名S-T,就把该模式作为基本表Student所属的模式

修改基本表

ALTER TABLE <表名>
[ ADD [COLUMN] <新列名> <数据类型> [完整性约束] ]
[ ADD <表级完整性约束> ]
[ DROP [COLUMN] <列名> [ CASCADE | RESTRICT] ]
[ DROP CONSTRAINT <完整性约束名> [ RESTRICT | CASCADE ] ]
[ ALTER COLUMN <列名> <数据类型> ];
  • <表名>:要修改的基本表
  • ADD子句用于增加新列、新的列级完整性约束条件、新的表级完整性约束条件
  • DROP COLUMN子句用于删除表中的列
    • 如果指定了CASCADE短语,则自动删除引用了该列的其他对象
    • 如果指定了RESTRICT短语,则如果该列被其他对象引用,关系DBMS将拒绝删除该列
  • DROP CONSTRAINT子句用于伤处指定的完整性约束条件
  • ALTER COLUMN子句用于修改原有的列定义,包括修改列名和数据类型
1. 向Student表增加"入学时间"列,其数据类型为日期型
ALTER TABLE Student ADD S_entrance DATE;
/* 不管基本表中原来是否已有数据,新增加的列一律为空值 */
2. 将年龄的数据类型由字符型(假设原来的数据类型是字符型)改为整数
ALTER TABLE Student ALTER COLUMN Sage INT;
3. 增加课程名称必须取唯一值的约束条件
ALTER TABLE Course ADD UNIQUE(Cname);
4. 向SC表增加'选课学期'列,其数据类型为整型,默认值为1
ALTER TABLE SC ADD SC_term INT Default 1;
5. 向Student表的年龄添加检查约束,年龄大于0,小于100,同时给定约束名chk_age
ALTER TABLE Student ADD CONSTRAINT chk_age CHECK(Sage>0 and Sage<100);
6. 取消学生表的年龄检测约束条件
ALTER TABLE Student DROP CONSTRAINT chk_age;

删除基本表

DROP TABLE <表名> [ RESTRICT | CASCADE ];
  • RESTRICT:删除表是有限制的
    • 欲删除的基本表不能被其他表的约束所引用
    • 如果存在依赖该表的对象,则此表不能被删除
  • CASCADE:删除该表没有限制
    • 在删除基本表的同时,相关的依赖对象一起删除
1. 删除Student表
DROP TABLE Student CASCADE
/** 基本表定义被删除,数据被删除*  表上建立的索引、视图、触发器等一般也将被删除*  SC表依赖于Student表,也会被删除*/
2. 若表上建有视图,选择RESTRICT时表不能删除;选择CASCADE时可以删除,视图也会被删除
CREATE VIEW IS_Studetn
ASSELECT Sno, Sname, SageFROM StudentWHERE Sdept='IS';
DROP TABLE Student RESTRICT;
--ERROR:cannot drop table Student because other objects depend on it
DROP TABLE Student CASCADE;
--NOTICE: drop cascades to view IS_Student
SELECT * FROM IS_Student;
--ERROR: relation " IS_Student " does not exist

索引的建立与删除

建立索引的目的:加快查询速度

  • 关系DBMS中的常见索引:
    • 顺序文件上的索引
    • B+树索引——具有动态平衡的优点
    • 散列(hash)索引——具有查找速度快的特点
    • 位图索引
  1. 谁可以建立索引——数据库管理员、表的属主(建立表的人)
  2. 谁维护索引——关系DBMS自动完成
  3. 使用索引——关系DBMS自动选择合适的索引作为存取路径,用户不必也不能显式地选择索引

索引是关系数据库的内部实现技术,属于内模式的范畴

建立索引

CREATE [ UNIQUE ] [ CLUSTER ] INDEX <索引名> ON <表名> (<列名> [ <次序> ][, <列名> [ <次序> ] …… ]
);
  • <表名>:要建立索引的基本表的名字
  • 索引:可以建立在该表的一列或多列上,各列名之间用逗号分隔
  • <次序>:指定索引值的排列次序,升序:ASC,降序:DESC。缺省值:ASC
  • UNIQUE:此索引的每一个索引值只对应唯一的数据记录
  • CLUSTER:表示要建立的索引是聚簇索引
/* 在Student表的Sname列上建立一个聚簇索引 */
CREATE CLUSTER INDEX Stuname ON Student)Sname;
1. Sname按照升序的方式存放在物理存储设备上
2. 在最经常查询的列上建立聚簇索引以提高查询效率
3. 一个基本表只能建立一个聚簇索引
4. 经常更新的列不宜建立聚簇索引
为学生-课程数据库中的Student, Course, SC三个表建立索引。
Student表按学号升序建唯一索引;
Course表按课程号升序建唯一索引;
SC表按学号升序和课程号降序建唯一索引:
CREATE UNIQUE INDEX Stusno ON Student(Sno);
CREATE UNIQUE INDEX Coucno ON Course(Cno);
CREATE UNIQUE INDEX SCno ON SC(Sno ASC, Cno DESC);

修改索引

ALTER INDEX <旧索引名> RENAME TO <新索引名>
将SC表中的SCno索引名改为SCSno:
ALTER INDEX SCno RENAME TO SCSno;

删除索引

DROP INDEX <索引名>;

删除索引时,系统会从数据字典中删除有关该索引的描述

删除Student表的Stusname索引
DROP INDEX Stusname;

练习:

1. 在课程表Course上增加一列任课老师名Tname,类型为char(9)
ALTER TABLE Course ADD Tname char(9);
2. 将学生表Student的姓名列数据类型改为varchar(20)
ALTER TABLE Student ALTER Sname varchar(20);
3. 为选修表SC的成绩列添加约束,要求在0至100之间,约束名为chk_SC_grade
ALTER TABLE SC ADD CONSTRAINT chk_SC_grade CHECK(Grade>=0 and Grade<=100)
4. 为SC表按学号升序,成绩降序创建唯一索引
CREATE UNIQUE INDEX SCsno on SC(sno ASC, Cno DESC);

数据字典

  • 数据字典是关系DBMS内部的一组系统表,记录了数据库中所有定义信息:
    • 关系模式定义
    • 视图定义
    • 索引定义
    • 完整性约束定义
    • 各类用户对数据库的操作权限
    • 统计信息等

关系DBMS在执行SQL上的数据定义语句时,实际上就是在更新数据字典表中的相应信息

数据查询

SELECT [ ALL | DISTINCT ] <目标列表达式> [, <目标列表达式> ] ……
FROM <表名或视图名> [, <表名或视图名> ] ……
[ WHERE <条件表达式> ]
[ GROUP BT <列名1> [ HAVING <条件表达式> ] ]
[ ORDER BY <列名2> [ ASC | DESC ] ];
  • SELECT子句:指定要显示的属性列
  • FROM子句:指定查询对象(基本表或视图)
  • WHERE子句:指定查询条件
  • GROUP BY子句:对查询结果按指定列的值分组,该属性列值相等的元组为一组。通常会在每组中作用聚集函数
  • HAVING短语:只有满足指定条件的组才予以输出
  • ORDER BY子句:对查询结构表按指定列值的升序或降序排序

单表查询

  • 单表查询——查询仅涉及一个表:
    1. 选择表中的若干列
    2. 选择表中的若干元组
    3. ORDER BY子句
    4. 聚集函数
    5. GROUP BY子句

选择表中的若干列

/* 查询指定列 */
1. 查询全体学生的学号与姓名:
SELECT Sno, Sname FROM Student;
2. 查询全体学生的姓名、学号、所在系:
SELECT Sname, Sno, Sdept FROM Student;
/** 查询全部列*  1. 在SELECT关键字后面列出所有列名2. 将<目标列表达式>指定为 **/
查询全体学生的详细记录
SELECT Sno, Sname, Ssex, Sage, Sdept FROM Student;
等价于
SELECT * FROM Student;
/** 查询经过计算的值*  <目标列表达式>不仅可以是表中的属性列,也可以是表达式*/
1. 查询全体学生的姓名及其出生年份
SELECT Sname, 2021-Sage FROM Student; /* 当前是2021年 */
2. 查询全体学生的姓名、出生年份和所在的院系,要求用小写字母表示系名
SELECT Sname, 'Year of Birth:', 2021-Sage, LOWER(Sdept) FROM Student;
Sname‘Year of Birth:’2021-SageLOWER(Sdept)
李勇Year of Birth:2001cs
刘晨Year of Birth:2002is
王敏Year of Birth:2003ma
张立Year of Birth:2002is
/* 使用列别名改变查询结果的列标题 */
SELECT Sname NAME, 'Year of Birth:' BIRTH, 2021-Sage BIRTHDAY, LOWER(Sdept) DEPARTMENT FROM Student;
NAMEBIRTHBIRTHDAYDEPARTMENT
李勇Year of Birth:2001cs
刘晨Year of Birth:2002is
王敏Year of Birth:2003ma
张立Year of Birth:2002is
1. 查询所有的课程号、课程名
SELECT Cno, Cname FROM Course;
2. 查询所有选课的学生学号
SELECT DISTINCT Sno FROM SC;
3. 查询所有被选修的课程号
SELECT DISTINCT Cno FROM SC;
4. 查询选修学生的学号、成绩、丢失的分数,并非丢失的分数起名为'失误分'(设定满分100)
SELECT Sno, Grade, 100-Grade '失误分' FROM SC;

选择表中的若干元组

/* 消除取值重复的行 - DISTINCT 关键字 */
1. 查询选修了课程的学生学号(不消除重复行)
SELECT Sno FROM SC;
等价于 /* 即不指定DISTINCT关键字时,默认缺省为ALL */
SELECT ALL Sno FROM SC;
2. 查询选修了课程的学生学号(消除重复行)
SELECT DISTINCT Sno FROM SC;

查询满足条件的元组:

查询条件谓词
比较=, >, <, >=, <=, !=, <>, !>, !<; NOT+上述比较运算符
确定范围BETWEEN AND, NOT BETWEEN AND
确定集合IN, NOT IN
字符匹配LIKE, NOT LIKE
空值IS NULL, IS NOT NULL
多重条件(逻辑运算)AND, OR, NOT
/* 比较大小 */
1. 查询计算机科学系全体学生的名单
SELECT Sname FROM Student WHERE Sdept='CS';
2. 查询所有年龄在20岁以下的学生姓名及其年龄
SELECT Sname, Sage FROM Student WHERE Sage<20;
3. 查询考试成绩有不及格的学生的学号
SELECT DISTINCT Sno FROM SC WHERE Grade<60;
/* 确定范围 */
1. 查询年龄在20~23岁(包括20和23岁)之间的学生的姓名、系别和年龄
SELECT Sname, Sdept, Sage FROM Student WHERE Sage BETWEEN 20 AND 23;
2. 查询年龄不在20~23岁之间的学生的姓名、系列和年龄
SELECT Sname, Sdept, Sage FROM Student WHERE Sage NOT BETWEEN 20 AND 23;
/* 确定集合 */
1. 查询计算机科学系(CS)、数学系(MA)和信息系(IS)学生的姓名和性别
SELECT Sname, Ssex FROM Student WHERE Sdept IN ('CS', 'MA', 'IS');
2. 查询既不是计算机科学系、数学系,也不是信息系的学生的姓名和性别
SELECT Sname, Ssex FROM Student WHERE Sdept NOT IN ('CS', 'MA', 'IS');
/* 字符匹配 */
谓词:[NOT] LIKE '<匹配串>' [ESCAPE '<换码字符>']
ESCAPE '\' 表示'\'是换码字符,可以将通配符转义为普通字符
  • <匹配串>可以是一个完整的字符串,也可以含有通配符%和_
    • % (百分号):代表任意长度(长度可以为0)的字符串
      • 例如a%b表示以a开头,以b结尾的任意长度的字符串
    • _ (下划线):代表任意单个字符
      • 例如a_b表示以a开头,以b结尾的长度为3的任意字符串
/* 字符匹配 */
1. 查询学号为201215121的学生的详细情况(下面两种查询等价)
SELECT * FROM Student WHERE Sno LIKE '201215121';
SELECT * FROM Student WHERE Sno='201215121';
2. 查询所有姓刘学生的姓名、学号和性别
SELECT Sname, Sno, Ssex FROM Student WHERE Sname LIKE '刘%';
3. 查询姓'欧阳'且全名为三个汉字的学生的姓名
SELECT Sname FROM Student WHERE Sname LIKE '欧阳_';
4. 查询名字中第2个字为'阳'字的学生的姓名和学号
SELECT Sname, Sno FROM Student WHERE Sname LIKE '_阳%';
5. 查询所有不姓刘的学生的姓名、学号和性别
SELECT Sname, Sno, Ssex FROM Student WHERE Sname NOT LIKE '刘%';
6. 查询DB_Design课程的课程号和学分
SELECT Cno, Ccredit FROM Course WHERE Cname LIKE 'DB\_Design' ESCAPE '\';
/* ESCAPE '\' 表示'\'是换码字符 */
7. 查询以'DB_'开头,且倒数第3个字符为i的课程的详细情况
SELECT * FROM Course WHERE Cname LIKE 'DB\_%i__' ESCAPE '\';
/* 涉及空值的查询 */
谓词: IS NULL 或 IS NOT NULL (IS不能用=代替)
1. 某些学生选修课程后没有参加考试,所以有选课记录,但没有考试成绩。查询缺少成绩的学生的学号和相应的课程号
SELECT Sno, Cno FROM SC WHERE Grade IS NULL;
2. 查询所有有成绩的学生的学号和课程号
SELECT Sno, Cno FROM SC WHERE Grade IS NOT NULL;
/* 多重条件查询 */
逻辑运算符: AND 和 OR 来连接多个查询条件;且AND的优先级高于OR;可以用括号改变优先级
NOT可用来实现多种其他谓词:[NOT] IN;[NOT] BETWEEN …… AND ……
1. 查询计算机系年龄在20岁以下的学生姓名
SELECT Sname FROM Student WHERE Sdept='CS' AND Sage<20;
2. 查询计算机科学系(CS)、数学系(MA)和信息系(IS)学生的姓名和性别
SELECT Sname, Ssex FROM Student WHERE Sdept IN ('CS', 'MA', 'IS');
等价于
SELECT Sname, Ssex FROM Student WHERE Sdept='CS' OR Sdept='MA' OR Sdept='IS';

ORDER BY子句

可以按一个或多个属性列排序:升序——ASC;降序——DESC;缺省值为ASC

  • 对于空值,排序时显示的次序由具体的系统实现来决定
    • ASC:排序列为空值的元组最后显示
    • DESC:排序列为空值的元组最先显示
1. 查询选修了3号课程的学生的学号及其成绩,查询结果按分数降序排列
SELECT Sno, Grade FROM SC WHERE Cno='3' ORDER BY Grade DESC;
2. 查询全体学生情况,查询结果按所在系的系号升序排列,同一系的学生按年龄降序排列
SELECT * FROM Student WHERE ORDER BY Sdept, Sage DESC;

聚集函数

  • 统计元组个数:
    • COUNT(*)
  • 统计一列中值的个数:
    • COUNT([DISTINCT|ALL] *)
    • COUNT([DISTINCT|ALL] <列名>)
  • 计算一列值的总和(此列必须为数值型):
    • SUM([DISTINCT|ALL] <列名>)
  • 计算一列值的平均值(此列必须为数值型):
    • AVG([DISTINCT|ALL] <列名>)
  • 求一列中的最大值和最小值
    • MAX([DISTINCT|ALL] <列名>)
    • MIN([DISTINCT|ALL] <列名>)
1. 查询学生总人数
SELECT COUNT(*) FROM Student;
2. 查询选修了课程的学生人数
SELECT COUNT(DISTINCT Sno) FROM SC;
3. 计算1号课程的学生平均成绩
SELECT AVG(Grade) FROM SC WHERE Cno='1';
4. 查询选修1号课程的学生的最高分数
SELECT MAX(Grade) FROM SC WHERE Cno='1';
5. 查询学生201215012选修课程的总分数
SELECT SUM(Grade) FROM SC WHERE Sno='201215012'
6. 查询学生201215012选修课程的总学分数
SELECT SUM(Ccredit) FROM SC, Course WHERE Sno='201215012' AND SC.Cno=Course.Cno;

GROUP BY语句

  • 目的:细化聚集函数的作用对象
    • 如果未对查询结果分组,聚集函数将作用于整个查询结果
    • 对查询结果分组后,聚集函数将分别作用于每个组
    • 按指定的一列或多列值分组,值相等的为一组
1. 求各个课程号及相应的选课人数
SELECT Cno, COUNT(Sno) FROM SC GROUP BY Cno;
2. 查询选修了3门以上课程的学生学号
SELECT Sno FROM SC GROUP BY Sno HAVING GOUNT(*)>3;
/* WHERE不能用聚集函数作为条件表达式 */
3. 查询平均成绩大于等于90分的学生学号和平均成绩
SELECT Sno, ACG(Grade) FROM SC GROUP BY Sno HAVING AVG(Grade)>=90;
  • HAVING短语与WHERE子句的区别——作用对象不同:
    • WHERE子句作用于基表或视图,从中选择满足条件的元组
    • HAVING短语作用于组,从中选择满足条件的组

练习:

1. 查询学号为200215121的学生的年龄
SELECT Sage FROM Student WHERE Sno='200215121';
2. 查询年龄在16至20岁之间的学生的姓名
SELECT Sname FROM Student WHERE Sage BETWEEN 16 AND 20;
3. 查询姓名为四个字的学生的学号和姓名
SELECT Sno, Sname FROM Student WHERE Sname='____';
4. 查询'数据库_上机'课程的课程号及学分
SELECT Cno, Ccredit FROM Course WHERE Sname='数据库\_上机' ESCAPE '\';
5. 查询李姓同学的全部信息
SELECT * FROM Student WHERE Sname='李%';
6. 查询计算机系和信息系所有男同学的姓名
SELECT Sname FROM Student WHERE Ssex='男' AND Sdept IN ('CS', 'IS');
设数据库有3张表:
课程表C(Cno, Cname, Ccredit, Tname)
学生表S(Sno, Sname, Sage, Ssex, Sdept)
选课表SC(Sno, Cno, Score)
1. 检索所有男同学的学号、姓名
SELECT Sno, Sname FROM S WHERE Ssex='男';
2. 检索Liu老师所教的课程名
SELECT Cname FROM C WHERE Tname='Liu';
3. 检索Wang同学所在的学院
SELECT Sdept FROM S WHERE Sname='Wang';
4. 统计每门课的平均成绩
SELECT Cno, AVG(Grade) FROM SC GROUP BY Cno;
5. 统计每个学生的平均成绩
SELECT Sno, AVG(Grade) FROM SC GROUP BY Sno;
6. 统计每门课程的选修学生人数(超过10人的课程才统计)
SELECT Cno, COUNT(Sno) FROM SC GROUP BY Cno HAVING COUNT(Sno)>10;
7. 检索姓名以L打头的所有学生的姓名、出生年份
SELECT Sname, 2021-Sage FROM S WHERE Sname LIKE 'L%';
8. 检索课程名以"_上机"打头的课程号、课程名、任教教室名
SELECT Cno, Cname, Tname FROM C WHERE Cname LIKE '\_上机' ESCAPE '\';

连接查询

  • 连接查询:同时涉及多个表的查询
  • 连接条件或连接谓词:用来连接两个表的条件
连接条件、连接谓词的一般格式:
[<表名1>.]<列名1> <比较运算符> [<表名2>.]<列名2>
[<表名1>.]<列名1> BETWEEN [<表名2>.]<列名2> AND [<表名2>.]<列名3>
  • 连接字段:连接谓词中的列名称

连接条件中的各连接字段类型必须是可比的,但名字不必是相同的

等值与非等值连接查询

  • 等值连接:连接运算符为=
查询每个学生及其选修课程的情况:
SELECT Student.*, SC.* FROM Student, SC WHERE Student.Sno=SC.Sno;

  • 自然连接:
用自然连接完成——查询每个学生及其选修课程的情况
SELECT Student.Sno, Sname, Ssex, Sage, Sdept, Cno, Grade FROM Student, SC WHERE Student.Sno=SC.Sno;
//与前一个只使用等值连接的区别——Sno项仅作为Student.Sno出现一次,不会出现两列

自身连接

  • 自身连接:一个表与其自己进行连接
    • 需要给表起别名以示区别
    • 由于所有属性名都是同名属性,因此必须使用别名前缀
查询每一门课的间接先修课(即先修课的先修课)
SELECT FIRST.Cno, SECOND.Cpno FROM Course FIRST, Course SECOND WHERE FIRST.Cpno=SECOND.Cno;

  • 嵌套循环法(NESTED-LOOP)
    • 首先在表1中找到第一个元素,然后从头开始扫描表2,逐一查找满足连接件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组
    • 表2全部查找完后,再找表1中第二个元组,然后再从头开始扫描表2,逐一查找满足连接条件的元组,找到后就将表1中的第二个元组与该元组拼接起来,形成结果表中一个元组
    • 重复上述操作,直到表1中的全部元组都处理完毕
  • 排序合并法(SORT-MERGE)——常用于=连接
    • 首先按连接属性对表1和表2排序
    • 对表1的第一个元组,从头开始扫描表2,顺序查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。当遇到表2中第一条大于表1连接字段值的元组时,对表2的查询不再继续
    • 找到表1的第二个元组,然后从刚才的中断点处继续顺序扫描表2,查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。直到遇到表2中大于表1连接字段值的元组时,对表2的查询不再继续。
    • 重复上述操作,直到表1或表2中的全部元组都处理完毕为止
  • 索引连接(INDEX-JOIN)
    • 对表2按连接字段建立索引
    • 对表1中的每个元组,依次根据其连接字段值查询表2的索引,从中找到满足条件的元组,找到后就将表1的第一个元组与该元组拼接起来,形成结果表中一个元组

外连接

  • 外连接与普通连接的区别
    • 普通连接操作只输出满足连接条件的元组
    • 外连接操作以指定表为连接主体,将主体表中不满足连接条件的悬浮元组一并输出
用左外连接完成——查询每个学生及其选修课程的情况
SELECT Student.Sno, Sname, Ssex, Sage, Sdept, Cno, Grade FROM Student LEFT OUTER JOIN SC ON (Student.Sno=SC.Sno);

  • 左外连接:列出左边关系中所有的元组——LEFT OUTER JOIN
  • 右外连接:列出右边关系中所有的元组——RIGTH OUTER JOIN

复合条件连接

  • 复合条件连接:WHERE子句中含多个连接条件
1. 查询选修2号课程且成绩在90分以上的所有学生
SELECT Student.Sno, Sname FROM Student, SC WHERE Student.Sno=SC.Sno AND SC.Cno='2' AND SC.Grade>90;
2. 查询每个学生的学号、姓名、选修的课程名及成绩
SELECT Student.Sno, Sname, Cname, Grade FROM Student, SC, Course WHERE Student.Sno=SC.Sno AND Course.Cno=SC.Cno;

嵌套查询

嵌套查询:一个SELECT-FROM-WHERE语句称为一个查询块,将一个查询块嵌套在另一个查询块的WHERE子句或HAVING短语的条件中的查询称为嵌套查询

-- 嵌套查询示例
SELECT Sname
FROM Student
WHERE Sno IN(SELECT SnoFROM SCWHERE Cno='2'
);
  • 上层的查询块称为外层查询父查询
  • 下层的查询块称为内层查询子查询

SQL语言允许多层嵌套查询,即一个子查询中还可以嵌套其他子查询。

  • 子查询的限制——不能使用ORDER BY子句
  • 嵌套查询求解方法
    • 不相关子查询:子查询的查询条件不依赖于父查询
      • 由里向外逐层处理。即每个子查询在上一级查询处理之前求解,子查询的结果用于建立其父查询的查找条件
    • 相关子查询:子查询的查询条件依赖于父查询
      1. 首先取外层查询中表的第一个元组,根据它与内层查询相关的属性值处理内层查询,若WHERE子句返回值为真,则取此元组放入结果表
      2. 然后再取外层表的下一个元组
      3. 重复这一过程,直至外层表全部检查完为止

带有IN谓词的子查询

-- 查询与"刘晨"在同一个系学习的学生
-- 为了便于理解,将过程分为三步:
-- 1. 确定"刘晨"所在系名
SELECT Sdept
FROM Student
WHERE Sname='刘晨';
-- 结果为——CS
-- 2. 查找所有在CS系学习的学生
SELECT Sno, Sname, Sdept
FROM Student
WHERE Sdept='CS';
-- 3. 将第一步查询嵌入到第二步查询的条件中
SELECT Sno, Sname, Sdept
FROM Student
WHERE Sdept IN (SELECT SdeptFROM StudentWHERE Sname='刘晨'
);
-- 当然,也可以使用自身连接来完成查询要求
SELECT FIRST.Sno, FIRST.Sname, FIRST.Sdept
FROM Student FIRST, Student SECOND
WHERE FIRST.Sdept=SECOND.SdeptAND SECOND.Sname='刘晨';
-- 查询选修了课程名为“信息系统”的学生学号和姓名
SELECT Sno, Sname
FROM Student
WHERE Sno IN (SELECT SnoFROM SCWHERE Cno IN (SELECT CnoFROM CourseWHERE Cname='信息系统')
);
-- 使用连接查询来完成查询要求
SELECT Student.Sno, Student.Sname
FROM Student, SC, Course
WHERE Student.Sno=SC.CnoAND SC.Cno=Course.CnoAND Course.Cname='信息系统';

带有比较运算符的子查询

当确切知道内层查询返回单值(有且仅有一个返回结果,且是一个字段而不是元组),可以用比较运算符:>, <, =, >=, <=, !=或<>

-- 查询与"刘晨"在同一个系学习的学生
-- 由于一个学生只可能在一个系学习,所以可以用=代替IN
SELECT Sno, Sname, Sdept
FROM Student
WHERE Sdept=(SELECT SdeptFROM StudentWHERE Sname='刘晨'
);
-- 找出每个学生超过他选修课程平均成绩的课程号
-- 可知这是一个相关子查询
SELECT Sno, Cno
FROM SC X
WHERE Grade>=(SELECT AVG(Grade)FROM SC YWHERE Y.Sno=X.Sno
);
  • 上述相关子查询示例的可能的执行过程
    1. 从外层查询中取出SC的一个元组X,将元组X的Sno值(201215121)传送给内层查
      • SELECT AVG(Grade) FROM SC Y WHERE Y.Sno=202115121;
    2. 执行内层查询,得到值88(近似值),用该值代替内层查询,得到外层查询
      • SELECT Sno, Cno FROM SC X WHERE Grade>=88;
    3. 执行这个查询,得到学号为201215121的同学的符合条件的元组:
      1. (201215121, 1)
      2. (201215121, 3)
    4. 重复执行上述的1.2.3.步骤,知道外层的SC元组全部处理完毕,结果:
      1. (201215121, 1)
      2. (201215121, 3)
      3. (201215122, 2)

带有ANY(SOME)或ALL谓词的子查询

使用ANY或ALL谓词时必须同时使用比较运算

谓词及比较运算语义
>ANY大于子查询结果中的某个值
>ALL大于子查询结果中的所有值
<ANY小于子查询结果中的某个值
<ALL小于子查询结果中的某个值
>=ANY大于等于子查询结果中的某个值
>=ALL大于等于子查询结果中的所有值
<=ANY小于等于子查询结果中的某个值
<=ALL小于等于子查询结果中的所有值
=ANY等于子查询结果中的某个值
=ALL等于子查询结果中的所有值
!=(或<>)ANY不等于子查询结果中的某个值
!=(或<>)ALL不等于子查询结果中的所有值
-- 查询非计算机科学系中比计算机科学系任意一个学生年龄小的学生姓名和年龄
SELECT Sname, Sage
FROM Student
WHERE Sdept!='CS'AND Sage<ANY(SELECT SageFROM StudentWHERE Sdept='CS'
);
-- 用聚集函数实现
SELECT Sname, Sage
FROM Student
WHERE Sdept<>'CS'AND Sage<ANY(SELECT MAX(Sage)FROM StudentWHERE Sdept='CS'
);
-- 查询非计算机科学系中比计算机科学系所有学生年龄都小的学生姓名和年龄
-- ALL谓词
SELECT Sname, Sage
FROM Student
WHERE Sdept<>'CS'AND Sage<ALL(SELECT SageFROM StudentWHERE Sdept='CS'
);
-- 用聚集函数实现
SELECT Sname, Sage
FROM Student
WHERE Sdept!='CS'AND Sage<(SELECT MIN(Sage)FROM StudentWHERE Sdept='CS'
);
=<>或!=<<=>>=
ANYIN<MAX<=MAX>MIN>=MIN
ALLNOT IN<MIN<=MIN>MAX>=MAX

带有EXISTS谓词的子查询

  • EXISTS谓词:带有EXISTS谓词的子查询不返回任何数据,只产生逻辑真值’true’或者逻辑假值’false’
    • 若内层查询结果非空,则外层的WHERE子句返回真值
    • 若内层查询结果为空,则外层的WHERE子句返回假值
  • 由EXISTS谓词引出的子查询,其目标列表表达式通常都用*,因为带EXISTS的子查询只返回真值或假值,给出列名无实际意义
  • NOT EXISTS谓词:
    • 若内层查询结果非空,则外层的WHERE子句返回假值
    • 若内层查询结果为空,则外层的WHERE子句返回真值
-- 查询所有选修了1号课程的学生姓名
SELECT Sname
FROM Student
WHERE EXISTS(SELECT *FROM SCWHERE SC.Sno=Student.SnoAND Cno='1'
);
-- 查询没有选修1号课程的学生姓名
SELECT Sname
FROM Student
WHERE NOT EXISTS(SELECT *FROM SCWHERE SC.Sno=Student.SnoAND Cno='1'
);
  • 不同形式的查询间的替换
    • 一些带EXISTS或NOT EXISTS谓词的子查询不能被其他形式的子查询等价替换
    • 所有带IN谓词、比较运算符、ANY和ALL谓词的子查询都能用带EXISTS谓词的子查询等价替换
-- 查询与'刘晨'在同一个系学习的学生
-- 用带EXISTS谓词的子查询
SELECT Sno, Sname, Sdept
FROM Student FIRST
WHERE EXISTS (SELECT *FROM Student SECONDWHERE SECOND.Sdept=FIRST.SdeptAND SECOND.Sname='刘晨'
);
  • 用EXISTS/NOT EXISTS实现全称量词(难点)
    • SQL语言中没有全称量词(FOR ALL)
    • 可以把带有全程量词的谓词转换为等价的带有存在量词的谓词

-- 查询选修了全部课程的学生姓名
-- 用带EXISTS/NOT EXISTS谓词的子查询实现全称量词(FOR ALL)
SELECT Sname
FROM Student
WHERE NOT EXISTS (SELECT *FROM CourseWHERE NOT EXISTS (SELECT *FROM SCWHERE SC.Sno=Stuent.SnoAND SC.Cno=Course.Cno)
);
假设学号为1,课程号为2,在SC表中若不存在此对应项的元组,则最内层的查询语句返回的是"查询结果为空",对于NOT EXISTS谓词,即返回"逻辑真值",则在中间的查询语句返回的是"查询结果非空",对于NOT EXISTS谓词,即返回"逻辑假值",则最外层的查询语句得到了"逻辑假值",说明学号为1的学生存在课程没选修,不满足选修了全部课程的条件,开始查询下一个学生。
  • 使用EXISTS/NOT EXISTS谓词实现逻辑蕴涵(难点)
    • SQL语言中没有蕴涵(Implication)逻辑运算
    • 可以利用谓词演算将逻辑蕴涵谓词等价转换

-- 查询至少选修了学生201215122选修的全部课程的学生号码
SELECT DISTINCT Sno
FROM SC SCX
WHERE NOT EXISTS(SELECT *FROM SC SCYWHERE SCY.Sno='201215122'AND NOT EXISTS(SELECT *FROM SC SCZWHERE SCZ.Sno=SCX.SnoAND SCZ.Cno=SCY.Cno)
);

集合查询

  • 集合操作的种类

    • 并操作UNION
    • 交操作INTERSECT
    • 差操作EXCEPT
  • 参加集合操作的各查询结果的列数必须相同;对应项的数据类型也必须相同

  • UNION:将多个查询结果合并起来时,系统自动去掉重复元组

  • UNION ALL:将多个查询结果合并起来时,保留重复元组

-- 1. 查询计算机科学系的学生及年龄不大于19岁的学生
SELECT *
FROM Student
WHERE Sdept='CS'
UNION
SELECT Student
WHERE Sage<19;
-- 2. 查询选修了课程1或者选修了课程2的学生
SELECT Sno
FROM SC
WHERE Cno='1'
UNION
SELECT Sno
FROM SC
WHERE Cno='2';
-- 等价于
SELECT DISTINCT Sno FROM SC WHERE Cno='1' OR Cno='2';
-- 1. 查询计算机科学系的学生与年龄不大于19岁的学生的交集
SELECT *
FROM Student
WHERE Sdept='CS'
INTERSECT
SELECT *
FROM Student
WHERE Sage<=19;
-- 等价于
SELECT *
FROM Student
WHERE Sdept='CS'AND Sage<=19;
-- 2. 查询既选修了课程1又选修了课程2的学生
SELECT Sno
FROM SC
WHERE Cno='1'
INTERSECT
SELECT Sno
FROM SC
WHERE Cno='2';
-- 等价于
SELECT Sno
FROM SC
WHERE Cno='1'AND Sno IN(SELECT SnoFROM SCWHERE Cno='2'
);
-- 等价于
SELECT Sno
FROM SC FIRST, SC SECOND
WHERE FIRST.Sno=SECOND.SnoAND FIRST.Cno='1'AND SCOND.Cno='2'
-- 查询计算机系的学生与年龄不大于19岁的学生的差集
SELECT *
FROM Student
WHERE Sdept='CS'
EXCEPT
SELECT *
FROM Student
WHERE Sage<=19;
-- 等价于
SELECT Sno
FROM Student
WHERE Sdept='CS'AND Sage>19;

本文标签: 数据库系统