数据库和数据仓库管理教材.pptx

上传人:A**** 文档编号:15123006 上传时间:2023-07-01 格式:PPTX 页数:50 大小:187.38KB
下载 相关 举报
数据库和数据仓库管理教材.pptx_第1页
第1页 / 共50页
数据库和数据仓库管理教材.pptx_第2页
第2页 / 共50页
数据库和数据仓库管理教材.pptx_第3页
第3页 / 共50页
数据库和数据仓库管理教材.pptx_第4页
第4页 / 共50页
数据库和数据仓库管理教材.pptx_第5页
第5页 / 共50页
数据库和数据仓库管理教材.pptx_第6页
第6页 / 共50页
数据库和数据仓库管理教材.pptx_第7页
第7页 / 共50页
数据库和数据仓库管理教材.pptx_第8页
第8页 / 共50页
数据库和数据仓库管理教材.pptx_第9页
第9页 / 共50页
数据库和数据仓库管理教材.pptx_第10页
第10页 / 共50页
数据库和数据仓库管理教材.pptx_第11页
第11页 / 共50页
数据库和数据仓库管理教材.pptx_第12页
第12页 / 共50页
数据库和数据仓库管理教材.pptx_第13页
第13页 / 共50页
数据库和数据仓库管理教材.pptx_第14页
第14页 / 共50页
数据库和数据仓库管理教材.pptx_第15页
第15页 / 共50页
数据库和数据仓库管理教材.pptx_第16页
第16页 / 共50页
数据库和数据仓库管理教材.pptx_第17页
第17页 / 共50页
数据库和数据仓库管理教材.pptx_第18页
第18页 / 共50页
数据库和数据仓库管理教材.pptx_第19页
第19页 / 共50页
数据库和数据仓库管理教材.pptx_第20页
第20页 / 共50页
亲,该文档总共50页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

数据库和数据仓库管理教材.pptx

《数据库和数据仓库管理教材.pptx》由会员分享,可在线阅读,更多相关《数据库和数据仓库管理教材.pptx(50页珍藏版)》请在冰点文库上搜索。

数据库和数据仓库管理教材.pptx

数据库和数据仓库,第一节数据管理第二节数据库与数据库管理系统环境第三节关系数据库模型第四节数据库的建立第五节数据仓库与数据挖掘第六节高级数据库技术和高级数据库应用,第一节数据管理,数据组织的层次实体、属性和关键字数据管理的传统方法数据管理的数据库方法,数据组织的层次,将数据按照层次方式进行组织由位、字节、字段、记录、文件和数据库组成位、比特(Bit)位是计算机中最小的数据单位,其值为0或1,是一个二进制位。

字节(Byte)字节是由若干个二进制位组成的(通常是8位),可代表一个字符(如ASCII码)。

数据组织的层次,字段(Field)多个字符组成一个词或者一个完整的数字(如姓名、年龄)字段不能再分成有意义的数据单位记录(Record)由与某个特殊对象或活动有关的所有字段组成如学生姓名、性别、所在班级、专业、年龄等文件(File)同一类型的所有记录组成一个文件文件就是与某个特定主题相关的数据记录的集合数据库(Database)综合的、相关的文件集合不仅包含了所有的数据层次,还包含了各层次之间的关系,(字母J的ASCII码),数据的层次,举例,文件,字节,字段,记录,01001010,900811刘汉云2000-9-4,位,0,1,数据库,刘汉云,项目数据库,包含:

职员编号、姓名、聘用日期,职员文件,(名字字段),职员文件,部门文件,财务文件,900811刘汉云2000-9-4900206李卓宇2002-7-2910810张昕阳2001-8-2,数据的层次,实体、属性和关键字,实体(Entity)与所收集的数据相关的一类事物。

实体是指人、或者其它具体的事物。

如员工、库存、客户、订单、教室、学生,实体、属性和关键字,属性(Attribute)实体的某一方面的特征;学生(学号、姓名、年龄、性别、专业、班级)产品(产品编号、名称、供应商、类型、单位数量、单价、库存量、订购量、再订购量),实体、属性和关键字,关键字(PrimaryKey)定义:

用来识别记录的一个或一组字段,是识别记录和在文件中查找记录的标志;如,学生文件中的学号产品文件中的产品编号订单文件中的订单号,数据管理的传统方法,文件是相关数据记录的集合利用文件管理数据对每个特定的应用程序,都需要创建一个或多个数据文件,数据管理传统方法的不足,容易造成数据冗余(redundancy)在多个数据文件中重复出现相同的数据。

难以保证数据之间的一致性(consistency)难以保证对不同文件中相同数据的修改同时发生。

数据与程序独立性不高数据文件和维护它的相关程序之间过分依赖。

数据管理的数据库方法,数据库是逻辑相关的记录和文件的集合。

把先前提及的所有存储在独立文件中的记录归并在一个数据库内,以便让不同的应用程序存取。

储存在数据库中的数据既独立于使用它的计算机程序,也独立于存储它的外部存储器的类型。

数据库管理系统,DatabaseManagementSystem,DBMS在数据库管理系统中,应用程序不能直接从存储介质获得所需的数据。

应用程序必须先将数据访问请求提交给DBMS,再由DBMS负责从存储介质检索数据并提供给应用程序使用。

数据库方法的优点,减少了数据冗余,能够更有效地利用存储空间并增强数据的一致性。

也为应用提供了更大地利用数据的灵活性。

不同文件中的数据放在了同一个数据库,可以用多种方法定位数据并获得要处理的数据。

能够实现共享数据和信息资源。

第二节数据库与数据库管理系统环境,数据库及其特征数据库管理系统数据库查询语言数据的逻辑视图和物理视图DBMS负责联机事务处理(OnlineTransactionProcessing,OLTP)和联机分析处理(OnlineAnalyticalProcessing,OLAP)。

数据库及其特征,数据库的定义数据库(Database)是一个信息的集合,在这个集合中可以按照信息的逻辑结构对其进行组织与存取。

数据库由两部分组成信息本身信息的逻辑结构,数据库的特征,信息的集合一个数据库中包含多个信息相关的文件(表)。

销售数据库包含两个文件:

产品文件和供应商文件。

数据库的特征,逻辑结构在使用数据库时,对信息的组织与存取是根据信息的逻辑结构而不是物理结构进行的。

信息的逻辑结构包含在数据字典(DataDictionary)中。

数据库的特征,信息中的逻辑联系建立信息间的联系或关系意味着找出文件(表)之间的相互关系。

主关键字主关键字是数据库文件中的一个字段,它唯一地描述了一个记录。

如,产品文件中的产品ID,供应商文件中的供应商ID(图5-4)。

“供应商ID”同时也在产品文件中出现,这样通过这个共同的字段就建立了两个文件之间的逻辑关系。

当一个文件的主关键字出现在另一个相关的文件中时,我们称其为外部关键字。

数据库的特征,内在的完整性(Integrity)约束完整性约束是保证信息质量的一种规则比如产品ID不能重复产品文件中的供应商ID不能是供应商文件中没有的供应商ID,数据库管理系统,DatabaseManagementSystem是一组系统软件,能够集中并有效地管理数据以供应用程序访问。

相当于应用程序和物理数据文件之间的接口。

数据库管理系统的组成,数据定义语言数据字典数据操作语言,数据库管理系统组成,数据定义语言(DataDefinitionLanguage,DDL)定义和描述数据库内容和结构的正式语言。

格式:

CREATETABLE表名(字段名1数据类型(长度),字段名2数据类型(长度).)CREATETABLESTUDENT(STUDENT_NOINTEGER,NAMETEXT(8),SPECIALITY_NOTEXT(8)CREATETABLESTUDENT(STUDENT_NOINTEGER,NAMETEXT(8),SPECIALITY_NOTEXT(8),BIRTHDAYDATE,PHOTOGENERAL),数据库管理系统组成,数据字典(DataDictionary)自动生成或者手工生成的文件,用来存储数据元素的定义和特性。

数据字典包含着数据库中所含信息(字段)的逻辑结构,如名称、类型、格式、缺省值、有效范围等。

演示ACCESS。

数据库管理系统组成,数据操作语言(DataManipulationLanguage,DML)提供了一组从数据库中提取数据的命令。

SQL(StructuredQueryLanguage)是一种DML。

格式:

SELECT字段名1,字段名2,FROM表1,表2WHERE条件SELECT供应商ID,供应商名称FROM供应商文件WHERE城市=上海演示ACCESS,数据库查询语言(DML),自然语言查询LISTTHENAMESANDADDRESSESOFALLSUPPLIERSWHOLIVEINSHANGHAI仿效实例查询(QueryByExample,QBE)通过拖曳数据项等方法来查询数据。

数据库查询语言,结构化查询语言(StructuredQueryLanguage,SQL)可在大多数数据库环境中使用的标准的第4代结构化查询语言。

无论用户使用什么硬件或何种DBMS软件,SQL都将遵循已规定好的通则进行处理。

利用SQL可以查询不同数据库管理系统下的数据。

基本形式SELECTFROMWHERE,数据的逻辑视图和物理视图,DBMS把数据的逻辑视图和物理视图分开。

逻辑视图以最终用户所使用的直观的方式来显示数据。

物理视图则显示了数据的实际组织形式以及它在物理存储介质上的结构。

使用专门的数据库管理系统,使得物理数据库可用于不同应用程序所需的不同的逻辑视图。

数据的逻辑视图和物理视图,演示ACCESS。

物理视图产品:

表逻辑视图查询1:

产品(产品名称、供应商)查询2:

产品(产品名称、类别),第三节关系数据库模型,四种数据库模型层次型网状型关系型目前使用最为广泛面向对象,关系数据库(RelationalDatabase)模型,利用一系列的二维表存储信息。

在关系模型中,每个二维表都描述了一个实体或实体之间的联系。

图5-4、11(P93、99)二维表使描述信息间的关系十分便利,容易处理二维表所包含的信息。

关系数据库模型,可以灵活地查询数据库和建立报表。

查询单个表和多个表。

演示ACCESS订单ID、客户、订购日期、产品在建立关系数据库时,不必事先确定实体之间的所有联系,可以随时建立实体之间的联系。

先建立实体,再建立实体之间的联系。

第四节关系数据库的建立,确定实体和关键字确定实体之间联系利用E-R图得到关系为每个关系确定信息(字段)用数据定义语言创建数据库,学生选修课程管理,实体:

学生、专业、课程学生修课管理工作中的规定:

每位学生只能被安排到一个专业(第一专业),但一个专业可拥有许多学生;每位学生可选修多门课程,一门课程也会被若干学生选修,但并不一定每个学生都必须选修所有课程。

学生选修课程管理,学生选修报表样本,一、确定实体和主关键字,三个实体学生专业课程主关键字学号专业编号课程编号,二、确定实体之间的联系-画实体联系图,实体联系图(Entity-RelationshipDiagram,E-R图)矩形表示实体菱形表示实体之间的联系直线表示连接1代表只出现一次,M代表可出现多次,二、确定实体之间的联系-画实体联系图,二、确定实体之间的联系-画实体联系图,先画上矩形填上实体名判断是否有联系有联系画上菱形,判断联系是1还是M,三、利用E-R图得到关系,1、将每个实体转化为一个关系(二维表)学生、课程、专业(图5-13,P102)实体的属性作为关系中的字段学生、课程、专业的关键字?

2、将每个多对多的联系转换为一个关系(二维表)(图5-13,P102)选修复合关键字(学号和课程编号的组合),三、利用E-R图得到关系,3、将每个一对多的联系转换为一个关系(二维表)分配(关键字、外部关键字)4、合并具有相同关键字的关系(二维表)学生与分配合并,四、为每个关系确定信息(字段),确保每个关系中所含的信息(字段)确实处于正确的关系之中确保信息(字段)只依赖于所属关系的主关键字学生姓名是否是由学号决定的呢?

图5-14专业编号是否是由学号决定的呢?

图5-14专业名称是否也是由学号决定的吗?

图5-14专业名称这个字段该在那个关系中出现呢?

五、用数据定义语言创建数据库,根据前面四步的结果来,使用数据定义语言来创建关系(二维表)CREATETABLESTUDENT(STUDENT_NOINTEGER,NAMETEXT(8),SPECIALITY_NOINTEGER)CREATETABLESPECIALITY(SPECIALITY_NOINTEGER,SPECIALITY_NAMETEXT(18)CREATETABLECOURSE(COURSE_NOINTEGER,COURSE_NAMETEXT(18),CREDIT_HOURINTEGER)使用可视化的编程工具创建关系(二维表)ELECTIVE(STUDENT_NOINTEGER,COURSE_NOINTEGER,GRADEINTEGER)使用可视化的编程工具,第五节数据仓库与数据挖掘,使用传统的数据库技术,数据常常被保存在不同的运行系统中,难以收集到完整的数据,需要花费大量的时间去寻找和收集相关的数据。

通过数据仓库可以对企业的关键运行数据进行集成,进而产生一致、可靠和易于访问的数据形式。

数据仓库(DataWarehouse),DataWarehouse的定义:

信息的逻辑集合,这些信息来自于许多不同的业务数据库,并用于支持企业的信息分析活动和决策任务。

数据仓库的特征

(一),通过汇总和分类,数据仓库将来自于不同数据库的信息结合在一起。

数据仓库的特征

(二),数据仓库是多维的,MultidimensionalDatabase包含若干层的行列,Hypercube数据字典:

除包含信息的逻辑结构外,还包括信息的来源和处理方式。

来源:

信息是从哪个业务数据库中生成的。

处理方式:

信息是经过何种方法(总计、计数、平均、标准差等)处理的。

数据仓库的特征(三),数据仓库支持决策而不是事务处理数据库面向事务联机事务处理(OLTP)数据仓库支持决策联机分析处理(OLAP),数据挖掘工具,DataMiningTools是用户对数据仓库进行信息查询的软件工具。

支持OLAP概念和决策任务。

数据挖掘工具,包括:

查询与报表工具QBE,SQL,报表生成器。

智能代理(IntelligentAgent)应用各种像神经网络、模糊逻辑这样的人工智能工具,形成OLAP中“信息发现”的基础。

多维分析工具(MultidimensionalAnalysisTools)是一种横纵分割的技术,它允许人们从不同的角度来观看多维信息。

补充思考题,问题描述:

在产品、供应商、客户订单管理中,有以下一些规则:

1、一个供应商可供应多种产品,同一产品可由不同供应商提供;2、客户在一次订货中可能订购几种产品。

要求:

1、找出上述问题描述中的实体以及各实体的主关键字;2、用E-R图表示实体之间的联系;3、使用二维表定义实体的属性及实体之间的联系。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 初中教育 > 科学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2