决策树实验报告.docx

上传人:b****0 文档编号:17903609 上传时间:2023-08-04 格式:DOCX 页数:20 大小:1.40MB
下载 相关 举报
决策树实验报告.docx_第1页
第1页 / 共20页
决策树实验报告.docx_第2页
第2页 / 共20页
决策树实验报告.docx_第3页
第3页 / 共20页
决策树实验报告.docx_第4页
第4页 / 共20页
决策树实验报告.docx_第5页
第5页 / 共20页
决策树实验报告.docx_第6页
第6页 / 共20页
决策树实验报告.docx_第7页
第7页 / 共20页
决策树实验报告.docx_第8页
第8页 / 共20页
决策树实验报告.docx_第9页
第9页 / 共20页
决策树实验报告.docx_第10页
第10页 / 共20页
决策树实验报告.docx_第11页
第11页 / 共20页
决策树实验报告.docx_第12页
第12页 / 共20页
决策树实验报告.docx_第13页
第13页 / 共20页
决策树实验报告.docx_第14页
第14页 / 共20页
决策树实验报告.docx_第15页
第15页 / 共20页
决策树实验报告.docx_第16页
第16页 / 共20页
决策树实验报告.docx_第17页
第17页 / 共20页
决策树实验报告.docx_第18页
第18页 / 共20页
决策树实验报告.docx_第19页
第19页 / 共20页
决策树实验报告.docx_第20页
第20页 / 共20页
亲,该文档总共20页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

决策树实验报告.docx

《决策树实验报告.docx》由会员分享,可在线阅读,更多相关《决策树实验报告.docx(20页珍藏版)》请在冰点文库上搜索。

决策树实验报告.docx

决策树实验报告

LIAOCHENGUNIVERSITY

计算机学院实验报告

【2015~2016学年第1学期】

【一、基本信息】

【实验课程】

商务智能

【设课形式】

独立□非独立

【课程学分】

4

【实验项目】

实验三数据挖掘

【项目类型】

基础□综合□设计研究创新□其它[]

【项目学时】

【学生姓名】

王昭

【学号】

2013204636

【系别专业】

信息管理与信息系统

【实验班组】

2013级7班组台

【同组学生】

【实验室名】

【实验日期】

【报告日期】

【二、实验教师对报告的最终评价及处理意见】

 

实验成绩:

(涂改无效)

指导教师签名:

年月日

注:

要将实验项目、实验课程的成绩评定及课程考核办法明确告知学生,并报实验管理中心备案

 

【三、实验预习】

实验目的和要求:

理解数据挖掘过程,并设计数据挖掘应用案例。

实验内容和原理或涉及的知识点(综合性实验):

利用SQLServer2008BI开发环境创建一个具有决策树算法的挖掘结构。

(还可以建立“Microsoft聚类分析”挖掘模型和“MicrosoftNaiveBayes”挖掘模型,选作)

实验条件(实验设备、软件、材料等):

SQLServer数据库引擎

AnalysisServices

BusinessIntelligenceDevelopmentStudio

AdventureWorks2008R2DW2008示例数据库

 

实验设计方案(实验方法、步骤、操作过程、设计型实验、实验数据记录表格):

1、启动SQLServer2008BI的开发环境;

2、创建一个AnalysisServices项目,定义一个单个数据源,并向数据源视图添加一个表子集;

3、使用“数据挖掘向导”来创建TargetedMailing挖掘结构,在此挖掘结构中,创建一个具有决策树算法的挖掘模型;

4、理解决策树模型。

实验预习成绩(涂改无效)

合格□

不合格□

【四、实验过程、数据和实验结果记录】

实验方法、步骤、操作过程的记录描述或程序代码。

实验过程中输入/输出数据、程序运行结果的记录。

(可加附页)

(1)准备AnalysisServices数据库

1.打开程序->MicrosoftSQLServer2008->SQLServerBusinessIntelligenceDevelopmentStudio,启动SQLServer2008BI的开发环境。

2.在“文件”菜单上,指向“新建”,然后选择“项目”。

选中“项目类型”窗格中的“商业智能项目”。

选中“模板”窗格中的“AnalysisServices项目”。

在“名称”框中,将新项目命名为ASDataMining2008。

单击“确定”。

3.在BusinessIntelligenceDevelopmentStudio中,选择“项目”菜单中的“属性”。

在“属性页”窗格左侧的“配置属性”下,单击“部署”。

在“属性页”窗格右侧的“目标”下,确保“服务器”名称为localhost。

如果使用的是其他实例,请键入该实例的名称。

单击“确定”。

4.在“解决方案资源管理器”中,右键单击“数据源”文件夹,然后选择“新建数据源”。

在“欢迎使用数据源向导”页面中,单击“下一步”按钮

在“选择如何定义连接”页上,单击“新建”向AdventureWorksDW2008R2数据库中添加连接。

(注意此步骤前必须已经启动了sqlserver和sqlserverAnalysisservices,并确认两者的登录身份为localSystem)

在“服务器名称”框中,键入或选择安装了AdventureWorksDW2008R2的服务器的名称。

例如,如果是在本地服务器上承载该数据库,请键入localhost。

如果使用的是其他实例,请键入该实例的名称。

在“登录到服务器”组中,选择“使用Windows身份验证”

连接到一个数据库时,选择AdventureWorksDW2008R2数据库,然后单击“确定”。

单击“下一步”

5.在“模拟信息”页中,单击“使用服务帐户”,再单击“下一步”。

在“完成向导”页中,请注意数据源名称默认为AdventureWorksDW2008R2。

单击“完成”。

此时,解决方案资源管理器的“数据源”文件夹中将出现刚创建的新数据源AdventureWorksDW2008R2。

6.在解决方案资源管理器中,右键单击“数据源视图”并选择“新建数据源视图”。

在“欢迎使用数据源视图向导”页中,单击“下一步”。

在“选择数据源”页的“关系数据源”下方,选择在上一个任务中创建的AdventureWorksDW2008R2数据源。

单击“下一步”。

7.在“选择表和视图”页上,选择下列对象,然后单击右箭头键,将它们包括在新数据源视图中:

ProspectiveBuyer(dbo)-预期自行车购买者的表

vTargetMail(dbo)-有关以前的自行车购买者的历史数据的视图

单击“下一步”。

在“完成向导”页上,系统默认将数据源视图命名为AdventureWorksDW2008R2。

将该名称更改为TargetedMailing,然后单击“完成”。

新数据源视图随即在“TargetedMailing.dsv[设计]”选项卡中打开

(2)生成TargetedMailing结构

1.在解决方案资源管理器中,右键单击“挖掘结构”并选择“新建挖掘结构”启动数据挖掘向导。

在“欢迎使用数据挖掘向导”页上,单击“下一步”。

在“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”,

再单击“下一步”。

在“创建数据挖掘结构”页的“你们要使用何种数据挖掘技术?

”下,选择“Microsoft决策树”。

2.单击“下一步”。

在“选择数据源视图”页上的“可用数据源视图”窗格中,选择TargetedMailing。

可单击“浏览”查看数据源视图中的各表,然后单击“关闭”返回该向导。

单击“下一步”。

制定表类型,指定定型数据。

实验方法、步骤、操作过程的记录描述或程序代码。

实验过程中输入/输出数据、程序运行结果的记录。

(可加附页)

在“指定列的内容和数据类型”页上,单击“检测”运行用来确定每列的默认数据类型和内容类型的算法。

在“创建测试集”页上,将“测试数据百分比”保留其默认值:

30。

对于“测试数据集中的最大事例数”,请键入1000。

单击“下一步”。

在“完成向导”页上的“挖掘结构名称”中,键入TargetedMailing。

在“挖掘模型名称”中,键入TM_Decision_Tree。

选中“允许钻取”复选框。

单击“完成”。

(3)处理挖掘模型

1.在BusinessIntelligenceDevelopmentStudio的数据挖掘设计器中,单击“挖掘结构”选项卡或“挖掘模型”选项卡。

TargetedMailingMiningStructure显示在“属性”窗格中。

确保按F4可以打开“属性”窗格。

确保CacheMode已设置为KeepTrainingCases。

HoldoutSeed设置为12。

.在“挖掘模型”菜单上选择“处理挖掘结构和所有模型”。

如果更改了结构,系统将提示你们在处理模型之前生成和部署项目。

单击“是”。

在“处理挖掘结构-TargetedMailing”对话框中单击“运行”。

实验结果分析

三个级别的决策树的预览图

四个级别的决策树的预览图:

把购买的与非购买的设置不同的背景颜色

在NumberChildernAtHome不等于1上看出(0表示非购买)数量是1313(1表示购买)数量是519

在Age>=38and<45节点上看出购买的是2559,非购买的是1454

(2)钻取到事例数据

钻取年龄与地区,年龄与收入可看出,两个表哥是一样的

BikeBuyer与所有属性的联系图:

年龄与BikeBuyer的关系最强烈:

地区与BikeBuyer的联系低于年龄,但也有较强的联系:

记录成绩(涂改无效)

合格□

不合格□

【五、实验结果分析】

根据理论知识对所得到的实验数据或结果进行解释、分析。

对实验结果所作的一般性的判断、归纳、概括,实验的心得体会、建议等。

1.通过这次的实验,又进一步的了解数据库AnalysisServices的功能,掌握了它的一些间的应用能力,和一些基本的操作。

2.通过应用数据库AnalysisServices的一些功能,能够分析一些数据之间的联系,有利于做出判断与决策。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2