数据库系统概述.docx
《数据库系统概述.docx》由会员分享,可在线阅读,更多相关《数据库系统概述.docx(19页珍藏版)》请在冰点文库上搜索。
数据库系统概述
数据库系统概述
目录
摘要……………………………………………1
正文
一、数据库的基本概念………………………2
二、计算机数据库系统…………………………5
三、数据库技术……………………………6
四、数据库中数据的性质……………………8
五、基本属性………………………………8
六、常用的数据库…………………………11
七、数据库安全……………………………13
八、数据库病毒检查方法……………………15
九、改进信息管理应用的建议………………17
十、数据库的现状…………………………17
总结…………………………………………19
参考文献……………………………………19
摘要:
数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于距今五十年前,随着信息技术和市场的发展,特别是二十世纪九十年代以后,数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。
数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。
随着计算机技术的飞速发展,利用计算机来获得和处理信息是当今信息管理的一大特点,通过计算机可以将许多繁琐的工作简单化。
各种大量信息需要及时整理、查询,数据库的一个很好的平台,提供给了我们所要的工具。
论文简要概述的数据库的各方面情况,简单阐述了计算机数据库、数据库中的数据性质、安全问题和应用前景。
关键字:
数据库系统与技术数据性质
一、数据库的基本概念
1、数据库的基本概念
(1)数据和数据处理数据(Data)是用于描述现实世界中各种具体事物或抽象概念的,可存储并具有明确意义的符号,包括数字,文字,图形和声音等.数据处理是指对各种形式的数据进行收集,存储,加工和传播的一系列活动的总和.其目的之一是从大量的,原始的数据中抽取,推导出对人们有价值的信息以作为行动和决策的依据;目的之二是为了借助计算机技术科学地保存和管理复杂的,大量的数据,以便人们能够方便而充分地利用这些宝贵的信息资源。
(2)数据库,数据库(DataBase,DB)是存储在计算机辅助存储器中的,有组织的,可共享的相关数据集合.数据库具有如下特性:
1)数据库是具有逻辑关系和确定意义的数据集合;2)数据库是针对明确的应用目标而设计,建立和加载的.每个数据库都具有一组用户,并为这些用户的应用需求服务;3)一个数据库反映了客观事物的某些方面,而且需要与客观事物的状态始终保持一致。
2、数据库管理系统及其基本功能
数据库管理系统(DataBaseManagementSystem,DBMS)是对数据库进行管理的系统软件,它的职能是有效地组织和存储数据,获取和管理数据,接受和完成用户提出的各种数据访问请求.能够支持关系型数据模型的数据库管理系统,称为关系型数据库管理系统(RelationalDataBaseManagementSystem,RDBMS)。
RDBMS的基本功能包括以下4个方面:
1)数据定义功能:
RDBMS提供了数据定义语言(DataDefinitionLanguage,DDL),利用DDL可以方便地对数据库中的相关内容进行定义.例如,对数据库,表,字段和索引进行定义,创建和修改;2)数据操纵功能:
RDBMS提供了数据操纵语言(DataManipulationLanguage,DML),利用DML可以实现在数据库中插入,修改和删除数据等基本操作;3)数据查询功能:
RDBMS提供了数据查询语言(DataQueryLanguage,DQL),利用DQL可以实现对数据库的数据查询操作;4)数据控制功能:
RDBMS提供了数据控制语言(DataControlLanguage,DCL),利用DCL可以完成数据库运行控制功能,包括并发控制(即处理多个用户同时使用某些数据时可能产生的问题),安全性检查,完整性约束条件的检查和执行,数据库的内部维护(例如索引的自动维护)等。
RDBMS的上述许多功能都可以通过结构化查询语言(StructuredQueryLanguage,SQL)来实现的,SQL是关系数据库中的一种标准语言,在不同的RDBMS产品中,SQL中的基本语法是相同的。
此外,DDL、DML、DQL和DCL也都属于SQL。
3、数据库应用系统及其组成
数据库应用系统又简称为数据库系统,是指拥有数据库技术支持的计算机系统,它可以实现有组织地,动态地存储大量相关数据,提供数据处理和信息资源共享服务的功能。
各类人员主要参与数据库应用系统的需求分析、设计、开发、使用、管理和维护,他们在数据库应用系统的开发,运行及维护等阶段扮演着不同的角色,并起着不同的作用。
各类人员主要包括以下几种:
1)最终用户;2)系统分析员;3)应用程序员;4)数据库管理员(DataBaseAdministrator,DBA).
4、数据库的定义
数据库有很多种不同的定义,从不同的方面进行给出不同的定义,下面给出几种较为主流的定义:
定义1严格地说,数据库是“按照数据结构来组织、存储和管理数据的仓库”。
在经济管理的日常工作中,常常需要把某些相关的数据放进这样的“仓库”,并根据管理的需要进行相应的处理。
J.Martin给数据库下了一个比较完整的定义:
数据库是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,并为多种应用服务;数据的存储独立于使用它的程序;对数据库插入新数据,修改和检索原有数据均能按一种公用的和可控制的方式进行。
当某个系统中存在结构上完全分开的若干个数据库时,则该系统包含一个“数据库集合”。
定义2数据库是依照某种数据模型组织起来并存放二级存储器中的数据集合。
这种数据集合具有如下特点:
尽可能不重复,以最优方式为某个特定组织的多种应用服务,其数据结构独立于使用它的应用程序,对数据的增、删、改和检索由统一软件进行管理和控制。
从发展的历史看,数据库是数据管理的高级阶段,它是由文件管理系统发展起来的。
定义3所有的信息(数据率档)的编纂物,不论其是以印刷形式,计算机存储单元形式,还是其它形式存在,都应视为“数据库”。
数字化内容选择的原因有很多,概括起来主要有:
(1)存储空间的原因,数字化的产品是通过网络被广大用户存取利用,而大家都知道数字化产品是存放在磁盘阵列上的,磁盘阵列由服务器来管理,磁盘空间是有限的,服务器的能力也是有限的,不可能无限量地存入数字资源,这就需要我们对文献资源数字化内容进行选择。
(2)解决数字化生产高成本和图书馆经费有限性之间矛盾的需要。
几乎没有图书馆有充足的资源来对整个馆藏进行数字化,内容选择不可避免。
(3)数字资源管理的需要。
技术的快速发展使数字化项目所生成的数字资源的生命周期越来越短,投入巨资进行数字迁移是延长数字资源生命的一个重要途径,昂贵的维护成本就必须考虑数字化的内容选择。
数据库发展史数据库技术从诞生到现在,在不到半个世纪的时间里,形成了坚实的理论基础、成熟的商业产品和广泛的应用领域,吸引越来越多的研究者加入。
数据库的诞生和发展给计算机信息管理带来了一场巨大的革命。
三十多年来,国内外已经开发建设了成千上万个数据库,它已成为企业、部门乃至个人日常工作、生产和生活的基础设施。
同时,随着应用的扩展与深入,数据库的数量和规模越来越大,数据库的研究领域也已经大大地拓广和深化了。
数据库是一个充满活力和创新精神的领域。
就让我们沿着历史的轨迹,追溯一下数据库的发展历程。
传统上,为了确保企业持续扩大的IT系统稳定运行,一般用户信息中心往往不仅要不断更新更大容量的IT运维软硬件设备,极大浪费企业资源;更要长期维持一支由数据库维护、服务器维护、机房值班等各种维护人员组成的运维大军,维护成本也随之节节高升。
定义4数据库(DataBase,DB)是一个长期存储在计算机内的、有组织的、有共享的、统一管理的数据集合。
她是一个按数据结构来存储和管理数据的计算机软件系统。
数据库的概念实际包括两层意思:
(1)数据库是一个实体,它是能够合理保管数据的“仓库”,用户在该“仓库”中存放要管理的事务数据,“数据”和“库”两个概念结合成为数据库。
(2)数据库是数据管理的新方法和技术,他能更合适的组织数据、更方便的维护数据、更严密的控制数据和更有效的利用数据。
二、计算机数据库系统
计算机数据库(Database)是存储在计算机内,为达到一定的目的而组织起来的有结构的数据(记录、文件等)的集合。
数据库系统的特点主要有以下几个方面:
1、数据结构化,在文件系统中,尽管其记录内部已有了某些结构,但记录之间没有联系。
而数据库系统则实现了整体数据的结构化,这是数据库的主要特征之一,也是数据库与文件系统的本质区别。
2、数据的共享性高、冗余度低、易于扩充;数据库系统从整体角度看待和描述数据,数据不再面向某个特定的应用程序,而是面向整个系统;因此,数据可以被多个用户、多个应用程序共享使用。
数据共享可以大大减少数据冗余,节约存储空间。
数据共享还能够避免数据之间的不相容性与不一致性。
3、数据独立性高,数据独立性包括数据的物理独立性和逻辑独立性。
物理独立性是指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的。
也就是说,数据在磁盘上的数据库中如何存储是由DBMS管理的,用户程序不需要了解,应用程序要处理的只是数据的逻辑结构,这样一来当数据的物理存储结构改变时,用户的程序不用改变。
逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,也就是说,数据的逻辑结构改变了,用户程序也可以不改变。
4、数据由DBMS统一管理和控制;数据库的共享是并发的(concurrency)共享,即多个用户可以同时存取数据库中的数据,甚至可以同时存取数据库中的同一个数据。
DBMS必须提供以下几方面的数据控制功能:
数据的安全性保护(security),数据的完整性检查(integrity),数据库的并发访问控制(concurrency,)数据库的故障恢复(recovery)。
在各类计算机数据库系统中,较广泛运用的有Ashton—Tate公司的DBASEIII、Foxsoftware公司的FoxBASE+,以及Microsoft公司的Access,Borland公司的Paradox。
前两者属于传统的关系型数据库。
从组成上来看计算机数据库一般包括以下一些内容:
1)结构化了的数据,独立于使用它们的程序;2)在一个单独的数据库中,字段名是唯一的;3)用公共通用的方法可以完成数据处理;4)具有连接、选择、投影的特点,可以进行数据库之间的关系运算。
数据库的这些优点极大地方便了数据库的使用,有效地提升了数据库资源的使用率,从而减少了大量的人力劳动,促进和实现了信息资源的进一步合理优化配置。
三、数据库技术
经过近四十年的发展,数据库技术已成为一项理论成熟,应用极广的数据管理技术.各种组织不仅借助数据库技术开发了信息系统,而且在其中存储并积累了大量的业务数据,为管理决策提供了丰富的数据基础.
1、数据管理技术的发展
数据管理技术是对数据进行分类、组织、编码、输入、存储、检索、维护和输出的技术.数据管理技术的发展大致经过了以下三个阶段:
人工管理阶段、文件系统阶段、数据库系统阶段。
(1)人工管理阶段,20世纪50年代以前,计算机主要用于数值计算。
从当时的硬件看,外存只有纸带、卡片、磁带,没有直接存取设备;从软件看(实际上,当时还未形成软件的整体概念),没有操作系统以及管理数据的软件;从数据看,数据量小,数据无结构,由用户直接管理,且数据间缺乏逻辑组织,数据依赖于特定的应用程序,缺乏独立性。
(2)文件系统阶段,50年代后期到60年代中期,出现了磁鼓,磁盘等数据存储设备。
新的数据处理系统迅速发展起来。
这种数据处理系统是把计算机中的数据组织成相互独立的数据文件,系统可以按照文件的名称对其进行访问,对文件中的记录进行存取,并可以实现对文件的修改,插入和删除,这就是文件系统。
文件系统实现了记录内的结构化,即给出了记录内各种数据间的关系。
但是,文件从整体来看却是无结构的。
其数据面向特定的应用程序,因此数据共享性,独立性差,且冗余度大,管理和维护的代价也很大。
(3)数据库系统阶段,60年代后期,出现了数据库这样的数据管理技术。
数据库的特点是数据不再只针对某一特定应用,而是面向全组织,具有整体的结构性,共享性高、冗余度小,具有一定的程序与数据间的独立性,并且实现了对数据进行统一的控制。
2、数据模型
(1)数据模型的概念及要素数据模型是现实世界在数据库中的抽象,也是数据库系统的核心和基础.数据模型通常包括3个要素:
1)数据结构,数据结构主要用于描述数据的静态特征,包括数据的结构和数据间的联系;2)数据操作,数据操作是指在数据库中能够进行的查询、修改、删除现有数据或增加新数据的各种数据访问方式,并且包括数据访问相关的规则;3)数据完整性约束,数据完整性约束由一组完整性规则组成。
(2)常用的数据模型,数据库理论领域中最常见的数据模型主要有层次模型,网状模型和关系模型3种:
1)层次模型(HierarchicalModel),层次模型使用树形结构来表示数据以及数据之间的联系;
(2)网状模型(NetworkModel),网状模型使用网状结构表示数据以及数据之间的联系;3)关系模型(RelationalModel)。
关系模型是一种理论最成熟,应用最广泛的数据模型.在关系模型中,数据存放在一种称为二维表的逻辑单元中,整个数据库又是由若干个相互关联的二维表组成的。
3、数据库技术的应用方式
从其应用方式来看,数据库技术主要起着两方面的作用。
(1)信息系统开发作用,利用数据库技术以及互联网技术,并结合具体的编程语言,可以开发一个信息系统,从而解决业务数据的输入和管理问题。
在信息系统开发中,主要利用的是RDBMS的基本功能,即数据定义功能,数据操纵功能,数据查询功能以及数据控制功能。
(2)数据分析与展示作用,利用RDBMS的数据查询功能对数据库中的数据进行关联组合或逐级汇总分析,并以表格、图形或报表形式将分析结果进行展示,从而解决业务数据的综合利用问题。
四、数据库中数据的性质
1、数据整体性:
数据库是一个单位或是一个应用领域的通用数据处理系统,他存储的是属于企业和事业部门、团体和个人的有关数据的集合。
数据库中的数据是从全局观点出发建立的,他按一定的数据模型进行组织、描述和存储。
其结构基于数据间的自然联系,从而可提供一切必要的存取路径,且数据不再针对某一应用,而是面向全组织,具有整体的结构化特征。
2、数据共享性:
数据库中的数据是为众多用户所共享其信息而建立的,已经摆脱了具体程序的限制和制约。
不同的用户可以按各自的用法使用数据库中的数据;多个用户可以同时共享数据库中的数据资源,即不同的用户可以同时存取数据库中的同一个数据。
数据共享性不仅满足了各用户对信息内容的要求,同时也满足了各用户之间信息通信的要求。
五、基本属性
1、基本结构
数据库的基本结构分三个层次,反映了观察数据库的三种不同角度。
(1)物理数据层,它是数据库的最内层,是物理存贮设备上实际存储的数据的集合。
这些数据是原始数据,是用户加工的对象,由内部模式描述的指令操作处理的位串、字符和字组成。
(2)概念数据层,它是数据库的中间一层,是数据库的整体逻辑表示。
指出了每个数据的逻辑定义及数据间的逻辑联系,是存贮记录的集合。
它所涉及的是数据库所有对象的逻辑关系,而不是它们的物理情况,是数据库管理员概念下的数据库。
(3)逻辑数据层,它是用户所看到和使用的数据库,表示了一个或一些特定用户使用的数据集合,即逻辑记录的集合。
数据库不同层次之间的联系是通过映射进行转换的。
2、主要特点
(1)实现数据共享,数据共享包含所有用户可同时存取数据库中的数据,也包括用户可以用各种方式通过接口使用数据库,并提供数据共享。
(2)减少数据的冗余度,同文件系统相比,由于数据库实现了数据共享,从而避免了用户各自建立应用文件。
减少了大量重复数据,减少了数据冗余,维护了数据的一致性。
(3)数据的独立性,数据的独立性包括数据库中数据库的逻辑结构和应用程序相互独立,也包括数据物理结构的变化不影响数据的逻辑结构。
(4)数据实现集中控制,文件管理方式中,数据处于一种分散的状态,不同的用户或同一用户在不同处理中其文件之间毫无关系。
利用数据库可对数据进行集中控制和管理,并通过数据模型表示各种数据的组织以及数据间的联系。
(5)数据一致性和可维护性,以确保数据的安全性和可靠性。
主要包括:
①安全性控制:
以防止数据丢失、错误更新和越权使用;②完整性控制:
保证数据的正确性、有效性和相容性;③并发控制:
使在同一时间周期内,允许对数据实现多路存取,又能防止用户之间的不正常交互作用;④故障的发现和恢复:
由数据库管理系统提供一套方法,可及时发现故障和修复故障,从而防止数据被破坏。
(6)故障恢复:
由数据库管理系统提供一套方法,可及时发现故障和修复故障,从而防止数据被破坏。
数据库系统能尽快恢复数据库系统运行时出现的故障,可能是物理上或是逻辑上的错误。
比如对系统的误操作造成的数据错误等。
3、种类
数据库通常分为层次式数据库、网络式数据库和关系式数据库三种。
而不同的数据库是按不同的数据结构来联系和组织的。
(1)数据结构模型
1)数据结构,所谓数据结构是指数据的组织形式或数据之间的联系。
如果用D表示数据,用R表示数据对象之间存在的关系集合,则将DS=(D,R)称为数据结构。
例如,设有一个电话号码簿,它记录了n个人的名字和相应的电话号码。
为了方便地查找某人的电话号码,将人名和号码按字典顺序排列,并在名字的后面跟随着对应的电话号码。
这样,若要查找某人的电话号码(假定他的名字的第一个字母是Y),那么只须查找以Y开头的那些名字就可以了。
该例中,数据的集合D就是人名和电话号码,它们之间的联系R就是按字典顺序的排列,其相应的数据结构就是DS=(D,R),即一个数组。
2)数据结构种类,数据结构又分为数据的逻辑结构和数据的物理结构。
数据的逻辑结构是从逻辑的角度(即数据间的联系和组织方式)来观察数据,分析数据,与数据的存储位置无关。
数据的物理结构是指数据在计算机中存放的结构,即数据的逻辑结构在计算机中的实现形式,所以物理结构也被称为存储结构。
这里只研究数据的逻辑结构,并将反映和实现数据联系的方法称为数据模型。
目前,比较流行的数据模型有三种,即按图论理论建立的层次结构模型和网状结构模型以及按关系理论建立的关系结构模型。
(2)层次、网状和关系数据库系统
1)层次结构模型,层次结构模型实质上是一种有根结点的定向有序树(在数学中"树"被定义为一个无回的连通图)。
按照层次模型建立的数据库系统称为层次模型数据库系统。
IMS(InformationManage-mentSystem)是其典型代表。
2)网状结构模型,按照网状数据结构建立的数据库系统称为网状数据库系统,其典型代表是DBTG(DataBaseTaskGroup)。
用数学方法可将网状数据结构转化为层次数据结构。
3)关系结构模型,关系式数据结构把一些复杂的数据结构归结为简单的二元关系(即二维表格形式)。
例如某单位的职工关系就是一个二元关系。
由关系数据结构组成的数据库系统被称为关系数据库系统。
在关系数据库中,对数据的操作几乎全部建立在一个或多个关系表格上,通过对这些关系表格的分类、合并、连接或选取等运算来实现数据的管理。
dBASEII就是这类数据库管理系统的典型代表。
对于一个实际的应用问题(如人事管理问题),有时需要多个关系才能实现。
用dBASEII建立起来的一个关系称为一个数据库(或称数据库文件),而把对应多个关系建立起来的多个数据库称为数据库系统。
dBASEII的另一个重要功能是通过建立命令文件来实现对数据库的使用和管理,对于一个数据库系统相应的命令序列文件,称为该数据库的应用系统。
因此,可以概括地说,一个关系称为一个数据库,若干个数据库可以构成一个数据库系统。
数据库系统可以派生出各种不同类型的辅助文件和建立它的应用系统。
六、常用的数据库
1、IBM的DB2
作为关系数据库领域的开拓者和领航人,IBM在1977年完成了SystemR系统的原型,1980年开始提供集成的数据库服务器—System/38,随后是SQL/DSforVSE和VM,其初始版本与SystemR研究原型密切相关。
DB2forMVSV1在1983年推出。
该版本的目标是提供这一新方案所承诺的简单性,数据不相关性和用户生产率。
1988年DB2forMVS提供了强大的在线事务处理(OLTP)支持,1989年和1993年分别以远程工作单元和分布式工作单元实现了分布式数据库支持。
最近推出的DB2UniversalDatabase6.1则是通用数据库的典范,是第一个具备网上功能的多媒体关系数据库管理系统,支持包括Linux在内的一系列平台。
2、Oracle
Oracle前身叫SDL,由LarryEllison和另两个编程人员在1977创办,他们开发了自己的拳头产品,在市场上大量销售,1979年,Oracle公司引入了第一个商用SQL关系数据库管理系统。
Oracle公司是最早开发关系数据库的厂商之一,其产品支持最广泛的操作系统平台。
目前Oracle关系数据库产品的市场占有率名列前茅。
3、Informix
Informix在1980年成立,目的是为Unix等开放操作系统提供专业的关系型数据库产品。
公司的名称Informix便是取自Information和Unix的结合。
Informix第一个真正支持SQL语言的关系数据库产品是InformixSE(StandardEngine)。
InformixSE是在当时的微机Unix环境下主要的数据库产品。
它也是第一个被移植到Linux上的商业数据库产品。
4、Sybase
Sybase公司成立于1984年,公司名称“Sybase”取自“system”和“database”相结合的含义。
Sybase公司的创始人之一BobEpstein是Ingres大学版(与System/R同时期的关系数据库模型产品)的主要设计人员。
公司的第一个关系数据库产品是1987年5月推出的SybaseSQLServer1.0。
Sybase首先提出Client/Server数据库体系结构的思想,并率先在SybaseSQLServer中实现。
5、SQLServer
1987年,微软和IBM合作开发完成OS/2,IBM在其销售的OS/2ExtendedEdition系统中绑定了OS/2DatabaseManager,而微软产品线中尚缺少数据库产品。
为此,微软将目光投向Sybase,同Sybase签订了合作协议,使用Sybase的技术开发基于OS/2平台的关系型数据库。
1989年,微软发布了SQLServer1.0版。
6、PostgreSQL
PostgreSQL是一种特性非常齐全的自由软件的对象—关系性数据库管理系统(ORDBMS),它的很多特性是当今许多商业数据库的前身。
PostgreSQL最早开始于BSD的Ingres项目。
PostgreSQL的特性覆盖了SQL-2/SQL-92和SQL-3。
首先,它包括了可以说是目前世界上最丰富的数据类型的支持;其次,目前PostgreSQL是唯一支持事务、子查询、多版本并行控制系统、数据完整性检查等特性的唯一的一种自由软件的数据库管理系统。
7、mySQL
mySQL是一个小型关系型数据库管理系统,开发者为瑞典MySQ