数据仓库与数据挖掘实验三数据挖掘Word下载.docx

上传人:b****2 文档编号:5655694 上传时间:2023-05-05 格式:DOCX 页数:11 大小:855.12KB
下载 相关 举报
数据仓库与数据挖掘实验三数据挖掘Word下载.docx_第1页
第1页 / 共11页
数据仓库与数据挖掘实验三数据挖掘Word下载.docx_第2页
第2页 / 共11页
数据仓库与数据挖掘实验三数据挖掘Word下载.docx_第3页
第3页 / 共11页
数据仓库与数据挖掘实验三数据挖掘Word下载.docx_第4页
第4页 / 共11页
数据仓库与数据挖掘实验三数据挖掘Word下载.docx_第5页
第5页 / 共11页
数据仓库与数据挖掘实验三数据挖掘Word下载.docx_第6页
第6页 / 共11页
数据仓库与数据挖掘实验三数据挖掘Word下载.docx_第7页
第7页 / 共11页
数据仓库与数据挖掘实验三数据挖掘Word下载.docx_第8页
第8页 / 共11页
数据仓库与数据挖掘实验三数据挖掘Word下载.docx_第9页
第9页 / 共11页
数据仓库与数据挖掘实验三数据挖掘Word下载.docx_第10页
第10页 / 共11页
数据仓库与数据挖掘实验三数据挖掘Word下载.docx_第11页
第11页 / 共11页
亲,该文档总共11页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

数据仓库与数据挖掘实验三数据挖掘Word下载.docx

《数据仓库与数据挖掘实验三数据挖掘Word下载.docx》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘实验三数据挖掘Word下载.docx(11页珍藏版)》请在冰点文库上搜索。

数据仓库与数据挖掘实验三数据挖掘Word下载.docx

然后选择人口统计特征列表,算法将从中确定模式:

婚姻状况、年收入、在家子女数和教育程度。

下一步需要训练模型,以便能够浏览树视图并从中读取模式。

市场部将根据这些模式设计新的会员卡,使其适应申请各类会员卡的客户类型。

二、所用仪器、材料(设备名称、型号、规格等)

操作系统平台:

Windows7

数据库平台:

SQLServer2008SP2

三、实验原理

知识发现被认为是从数据中发现有用知识的整个过程。

数据挖掘被认为是KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式。

KDD过程定义为:

KDD是从数据集中识别出有效出、新颖的、潜在有用的,以及最终可理解的模式的高级处理过程。

KDD过程可以概括为3部分:

数据准备(datapreparation),数据挖掘及结果的解释和评估(interpretation&

evaluation)。

数据挖掘的对象主要是关系数据库和数据仓库,这是典型的结构化数据。

随着技术的发展,数据挖掘对象逐步扩大到半结构化或非结构化数据,这主要是文本数据、图像与视频数据以及Web数据等。

数据挖掘任务有6项:

关联分析、时序模式、聚类、分类、偏差检测、预测。

数据挖掘方法是由人工智能、机器学习的方法发展而来,结合传统的统计分析方法、模糊数学方法以及科学计算可视化技术,以数据库为研究对象,形成了数据挖掘方法和技术。

数据挖掘方法和技术可以分为6大类:

1.归纳学习的信息论方法:

ID3等方法(决策树方法)、IBLE方法(决策规则树方法)

2.归纳学习的集合论方法:

粗糙集(roughset)方法、关联规则挖掘、覆盖正例排斥反例方法、概念树方法。

3.仿生物技术的神经网络方法:

前馈式网络、反馈式网络、自组织网络

4.仿生物技术的遗传算法:

繁殖(选择)、交叉(重组)、变异(突变)

5.数据数据的公式发现:

物理定律发现系统BACON、经验公式发现系统FDD

6.可视化技术:

提取几何图元、绘制、显示和演放

四、实验方法、步骤

要求:

利用实验室和指导教师提供的实验软件,认真完成规定的实验内容,真实地记录实验中遇到的各种问题和解决的方法与过程,并根据实验案例绘出多维数据组织模型及其OLAP操作过程。

实验完成后,应根据实验情况写出实验报告。

五、实验过程原始记录(数据、图表、计算等)

本实验使用MicrosoftSQLServer的数据挖掘工具,对一组电信运营商的客户数据进行挖掘,分析客户流失特征,以此来预测当前可能流失的客户,为企业营销提供支持。

◆首先将待挖掘数据(存放于文本文件中)导入数据库

先在数据库中建立数据表(若直接导入,相应字段的数据类型不匹配,会影响挖掘效果)

USE[DW]

GO

SETANSI_NULLSON

SETQUOTED_IDENTIFIERON

CREATETABLE[dbo].[大理PAS流失训练](

[SERV_ID][float]NULL,--服务ID

[CUST_ID][float]NULL,

[ZWSC][float]NULL,--在网时长

[BILLING_MODE_ID][float]NULL,

[PAYMENT_METHOD][float]NULL,--付费方式

[ORG_ID][float]NULL,--地区ID

[NEW_YXSX][float]NULL,

[ZWSC_DSC][nvarchar](255)NULL,

[KB][nvarchar](255)NULL,--捆绑其他业务

[AGE][nvarchar](255)NULL,--年龄

[LX][nvarchar](255)NULL,--来电显示

[CL][nvarchar](255)NULL,--彩铃

[FEE_ALL][nvarchar](255)NULL,

[YC][nvarchar](255)NULL,--预存

[IS_LS][float]NULL--是否流失,0表示未流失,1表示流失

)ON[PRIMARY]

导入待挖掘数据

◆打开Microsoft的SQLServerBusinessIntelligenceDevelopmentStudio工具,在实验二的OLAP项目中添加刚刚创建导入的数据表

执行挖掘算法,创建挖掘结构,并分析挖掘结果

1.Microsoft决策树

挖掘得到的决策树:

数据挖掘结果:

命中率:

覆盖率:

2.Microsoft神经网络

挖掘得到的模型:

六、实验结果、分析和结论(误差分析与数据处理、成果总结等。

其中,绘制曲线图时必须用计算纸)

通过本次实验,我们理解了数据挖掘中主要算法的基本原理和执行过程。

了解了数据挖掘的基本过程:

首先确定挖掘的任务和目的,然后选择挖掘算法,最后实施数据挖掘操作,获取有用的模式,其中选择挖掘算法时需要考虑不同数据的不同特点和用户或实际需求。

 

THANKS!

!

致力为企业和个人提供合同协议,策划案计划书,学习课件等等

打造全网一站式需求

欢迎您的下载,资料仅供参考

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2