东华理工大学聚类分析商务智能模型分析实施报告.docx
《东华理工大学聚类分析商务智能模型分析实施报告.docx》由会员分享,可在线阅读,更多相关《东华理工大学聚类分析商务智能模型分析实施报告.docx(13页珍藏版)》请在冰点文库上搜索。
东华理工大学聚类分析商务智能模型分析实施报告
《数据挖掘与商务智能》
课程考核论文
聚类分析商务智能模型分析实施报告
课程论文考核评分表
序号
考核点
考核内容
分值
成绩
1
课程论文
格式规范,结构完整
20
2
截图完整、正确、自主性强
20
3
结果分析准确,全面
20
4
数据挖掘流程正确,描述清析
20
5
挖掘工程
程序检查正确,与论文相一致
20
5
汇总
100
评分标准:
每一类别分A、B、C、D、E五大类型。
分别对应于分值的100%,80%,60%,40%。
A:
完全达到考核内容的要求。
B:
大部分达到考核内容的要求,在细节上有出入。
C:
基本达到考核内容的要求,出入比较明显。
D:
与要求相距较大,但能反映考核内容要求,如发现有明细抄袭痕迹,该部分的评分为D。
一、挖掘模型描述:
A
AdventureWorksCycles的市场部需要了解客户浏览AdventureWorksCycles网站的方式。
公司认为存在一个时序模式,客户以这种模式将产品放入其购物篮中。
它们希望分析购买序列的顺序,以了解客户如何向其购物篮中添加相关产品。
然后可使用上述信息简化网站的流程,这样便可引导客户购买更多的产品。
使用Microsoft聚类分析算法预测客户将放入购物篮中的下一个产品。
最后,使用这些模型创建预测,以向客户推荐产品。
2、挖掘流程描述:
1、导入AdventureWorksDW2008R2_Data数据库,打开企业管理器,右击数据库,点击“新建数据库”,新建数据库。
2、新建AnalysisServices项目
4、在解决方案资源管理器中,右击新建数据源,链接AdventureWorksDW2008R2_Data数据库。
5、使用服务账户。
6、新建数据源视图
7、添加vAssocSeqOrders、vAssocSeqLineItems视图
8、创建表之间的关系。
9、创建关联挖掘结构,在解决方案资源管理器中,右键单击“挖掘结构”,再选择“新建挖掘结构”以打开数据挖掘向导。
在“欢迎使用数据挖掘向导”页上,单击“下一步”。
在“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”,再单击“下一步”。
在“创建数据挖掘结构”页上,确保已选中选项“创建带有挖掘模型的挖掘结构”。
接下来,单击选项“您要使用何种数据挖掘技术?
”的下拉列表,然后选择“Microsoft聚类分析”。
单击“下一步”。
10、在“选择数据源视图”页随即显示。
在“可用数据源视图”下,选择“订单”。
“订单”也是用于市场篮方案的同一数据源视图.在“指定表类型”页上,选中vAssocSeqOrders表旁边的“事例”复选框,然后选中vAssocSeqLineItems表旁边的“嵌套”复选框。
单击“下一步”。
11、在“指定定型数据”页上,通过以下方式选中复选框,来选择要在模型中使用的列:
IncomeGroup选中“输入”复选框。
此列包含关于客户的重要相关信息,这些信息可以用于聚类分析。
您将在第一个模型中使用这些信息,然后在第二个模型中将其忽略。
OrderNumber选中“键”复选框。
此字段将用作事例表的标识符,也就是Key。
一般来说,在任何时候都不应使用事例表的键字段作为输入,因为该键包含的唯一值对聚类分析无用。
Region选中“输入”复选框。
此列包含关于客户的重要相关信息,这些信息可以用于聚类分析。
您将在第一个模型中使用这些信息,然后在第二个模型中将其忽略。
LineNumber选中“键”和“输入”复选框。
LineNumber字段将用作嵌套表的标识符,也就是SequenceKey。
必须始终将嵌套表的键用于输入。
Model选中“输入”和“可预测”复选框。
验证选择是否正确,然后单击“下一步”。
12、在“创建测试集”页上,将“测试数据百分比”更改为20,然后单击“下一步”。
在“完成向导”页的“挖掘结构名称”中,键入SequenceClusteringwithRegion。
在“挖掘模型名称”中,键入SequenceClusteringwithRegion。
选中“允许钻取”框,然后单击“完成”。
13、点击挖掘模型查看器,单击“是”。
单击“运行”。
15、运行结果。
三、挖掘结果分析。
可以看出,在分类特征选项卡中,滚动浏览该选项卡列表,找到了转换TouringTire,TouringTireTube。
这意味着此分类中的客户通常将这些项一起放入购物篮中,而且是严格按照这个顺序放入。