一、数据(Data):描述事物的符号记录成为数据。
二、数据库(DataBase):数据库是长期存储在计算机内、有组织的、可共享的大量数据的集合;数据库数据具有永久存储、有组织和可共享三个特点。
三、数据库管理系统(DataBase Management System,DBMS):数据库管理系统是位于用户与操作系统之间的一层数据管理软件。
数据库管理系统的功能:
1、数据定义功能(Data Definition Language,DDL):对数据库中的数据对象进行定义;
2、数据组织、存储和管理
3、数据操纵功能(Data Manipulation Language,DML):用户可以使用DML操纵数据,实现对数据库的基本操作,如查询、插入、删除和修改等;
4、数据库的事物管理和运行管理;
5、数据库的建立和维护功能;
6、其它功能:DBMS与网络中其它软件的通信功能;一个DBMS与另一个DBMS或文件系统的数据转换功能;异够数据库之间的互访和操作功能等。
四、数据库系统(DataBase System,DBS)
数据库系统是指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统()及其开发工具)、应用系统和数据库管理员组成。
数据管理技术的产生和发展
一、人工管理阶段
1、数据不保存
2、应用程序管理数据
3、数据不共享
4、数据不具有独立性
二、文件系统阶段
1、数据可以长期保存
2、由文件系统管理数据
缺点:
1、数据共享性差,冗余度大
2、数据独立性差
三、数据库系统阶段
1.数据结构化
2、数据的共享性高,冗余度低,易扩充
3、数据独立性高
4、数据由DBMS统一管理和控制
(1)数据库的安全性(Security)保护
(2)数据的完整性(Integrity)检查
(3)并发(Concurrency)控制
(4)数据库恢复(Recovery)
数据模型(Data Model)
数据模型是用来描述数据、组织数据和对数据进行操作的。
两类数据模型:
1、概念模型按用户的观点对数据和信息建模,主要用于数据库设计。
2、逻辑模型和物理模型
逻辑模型包括层次模型(Hierarchical Model)、网状模型(Network Model)、关系模型(Relational Model)、面向对象模型(Object Oriented Model)和对象关系模型(Object Relational Model)。
物理模型是对数据最低层的抽象,它描述数据库在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法,是面向计算机系统的。
数据模型是数据库系统的核心和基础。
数据模型的组成要素:
1、数据结构
2、数据操纵
3、数据的完整性约束条件。
一、概念模型
概念模型的一种表示方法:实体——联系方法(Entity-Relationship Approach),成为E-R模型。
实体性:用矩形框表示
属性:用椭圆表示
联系:用棱形表示
数据库领域最常用的逻辑数据库模型
一、层次模型
1、有且只有一个节点没有双亲节点,这个节点成为跟节点;
2、跟以外的其它节点有且只有一个双亲节点。
层次模型的一个基本特点是,任何一个给定的记录值只有按其路径查看时,才能显示出它的全部意义,没有一个子女记录值能够脱离双亲记录值而独立存在。
冗余节点法的优点是结构清晰,允许节点改变存储位置,缺点是需要额外占用存储空间,有潜在的不一致性。虚拟节点法的有点是减少对存储空间的浪费,避免产生潜在的不一致性,缺点是节点在改变存储位置可能引起虚拟节点中指针的修改。
层次模型的存储结构:邻接法和链接法
层次模型的优点:
1、层次模型的数据结构比较简单清晰。
2、层次数据库的查询效率高。
3、层次数据模型提供了良好的完整性支持。
层次模型的缺点:
1、现实世界中很多联系是非层次的,如节点之间具有多对多联系;
2、一个节点具有多个双亲等。
3、查询子女节点必须通过双亲节点。
4、由于结构严密,层次命令趋于程序化。
二、网状模型
1、允许一个以上节点无双亲;
2、一个节点可以有多余一个的双亲。
网状数据模型的操纵与完整性约束
1、支持记录码的概念,码即唯一标识记录的数据项的集合;
2、保证一个联系中双亲记录和子女记录之间是一对多的联系;
3、可以支持双亲记录和子女记录之间某些约束条件。
网状数据模型的优缺点:
优点:
1、能够更为直观地描述现实世界,如一个节点可以有多个双亲。节点之间可以有多种联系。
2、具有良好的性能,存取效率较高。
缺点:
1、结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握。
2、网状模型的DDL,DML复杂,并且要嵌入一种高级语言(如COBOL,C)中。用户不易掌握,不容易使用。
三、关系模型
关系模型是目前最重要的一种数据模型
关系模型要求关系必须是规范化的,即要求关系必须满足一定的规范条件,这些规范条件中最基本的一条就是,关系中的每一个分量必须是一个不可分割的数据项,也就是说,不允许表中还有表。
关系数据库的优点:
1、关系模型与格式化模型不同,它是建立在严格的数学概念的基础上的。
2、关系模型的概念单一。
3、关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作。
关系数据模型的缺点:
由于存取路径对用户透明,查询效率往往不如格式化数据模型。
数据库系统的三级模式结构
1、外模式
2、模式
3、内模式
模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是具有用户的公共数据视图。
外模式也称子模式或用户模式,是数据库用户能够看见个和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
外模式通常是模式的子集。
内模式也称存储模式,一个数据库只有一个内模式。是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。
内模式/模式映像:当模式改变时,由数据库管理员对各个外模式/模式的映像作相应改变,可以使外模式保持不变。应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性。
模式/内模式映像
当数据库的存储结构改变了,由数据库管理员对模式/内模式映像作相应改变,可以使模式保持不变,从而应用程序也不必改变。保证了数据与程序的物理独立性。