数据模型与决策分析案例.docx
《数据模型与决策分析案例.docx》由会员分享,可在线阅读,更多相关《数据模型与决策分析案例.docx(13页珍藏版)》请在冰点文库上搜索。
数据模型与决策分析案例
数据模型与决策分析案例
一、问题提出
美国R银行最近赢得了一份合同,为宾夕法尼亚的众多公司修建一个服务区,使得他们可以开启网上交易,便捷各自的生活。
R银行负责区域银行卡的网上注册,数据维护与测试。
为了完成这项工作,美国R银行的负责人兼总经理Bobxx估计,区域内所有员工银行卡的注册与网上注册所需要的总工期大约需要4个月,并且完成这项庞大的任务需要许多的云服务器支持,从各项数据,可以得知,从第1个月到第4个月需要的云服务器分别为10、12、14、8台云服务器。
虽然说到目前为止美国R银行已经有20台云服务器,但大部分的台云服务器都有任务,都要支持运行维护已经注册的人员的银行数据,因此,必须从从Pxx云服务器租赁公司租借部分的云服务器。
并且Bob估计,虽然说本公司这些云服务器有其他的任务,但每个月任然有部分可以抽调出来供这一份项目使用,第1个月有1台云服务器可以用于服务区的网上注册,数据维护与测试任务,第2个月有2台云服务器可以用于服务区任务,第3个月有3台云服务器可以用于服务区任务,第4个月有1台云服务器可以用于服务区任务。
因此为了完成任务,美国R银行还需要租借更多的云服务器来完成这一份合同。
从Pxx云服务器公司长期租用云服务器的费用是每台云服务器每月600美元。
云服务器的坐守监视工作人员的工资是每小时20美元,每台云服务器每天消耗流量电量等数据网络方面花费为100美元。
所有的云服务器维修费用由Pxx云服务器公司承担。
根据美国R银行工作计划,美国R银行每天工作8小时,每周5天,每月工作4周。
Bob认为现在的情况下,美国R银行如果长期租赁云服务器是不明智的。
在与Pxx云服务器公司对短期租赁合同进行讨论后,Bob了解到他可以获得1-4个月的短期租赁。
短期云服务器租赁和坐守监视技术人员的工资的价格水平都与长期租赁不同。
Pxx云服务器公司司同意支付短期租赁的成本。
以下是一台云服务器一个坐守监视技术人员的短期租赁费用。
租期期限(月)
每月成本(美元)
租期期限(月)
每月成本(美元)
1
4000
3
3225
2
3700
4
3040
分析美国R银行的生产问题,为美国R银行的总裁准备一份报告,告诉他们你的发现和建议。
报告包括以下几个方面(不仅于此):
(1)试问Bob希望在卡云服务器的需求得到满足的前提下,实现成本最小。
(2)在陈述上面的报告之前,美国R银行其实备用了另一个方案:
具体情况如下:
美国R银行准备加班进行,在二个月之内完工,每天工作12个小时,每周6天,每月工作还是4周,并且在正常工作时间之外,工资开支是正常情况下的三倍,也就是必须支付给员工每小时60美元的工资,并且第1个月月需要的云服务器为26台云服务器,第1个月月需要的云服务器为24台云服务器,同样的第1个月有1台云服务器可以用于服务区的网上注册,数据维护与测试任务,第2个月有2台云服务器可以用于服务区任务,由于云服务器工作时间的增加,每台云服务器每天消耗流量电量等数据网络方面花费为200美元。
其他的特殊说明的情况与案例中阐述的情况一样的。
试问Bob希望在云服务器的需求得到满足的前提下,实现成本最小。
(3)Bob希望在云服务器的需求得到满足的前提下,实现成本最小。
此外,Rxx云服务器租赁公司从未解雇过一名员工,为此Bob非常自豪。
这次Bob仍然坚持他的不解雇政策,即便这样会增加成本。
试问这样值不值得。
(4)以此次项目总的消费量成本为因变量,租用云服务器一个月的数量、租用云服务器二个月的数量,租用云服务器三个月的数量,租用云服务器四个月的数量为自变量时行回归。
试根据得到部分输出结果,回答下列问题:
1)“模型汇总表”中的R方和标准估计的误差是多少?
2)写出此回归分析所对应的方程;
3)将三个自变量对汽油消费量的影响程度进行说明;
4)对回归分析结果进行分析和评价,指出其中存在的问题。
相关的附录表格以及图形见下方:
附表一:
成本与各个月云服务器租赁数量相关性
成本
租云服务器一个月数量
租云服务器二个月的数量
租云服务器三个月数量
租云服务器四个月数量
成本
Person相关性显著性
N
1
.38
.958**
.000
.38
.960**
.000
.38
.967**
.000
.38
.975**
.000
.38
租云服务器一个月的数量
Person相关性显著性
N
.858**
.000
.38
1
.39
.697**
.000
.39
.775**
.000
.39
.815**
.000
.39
租云服务器二个月的数量
Person相关性显著性
N
.762**
.000
.38
.860**
.000
.39
1
.39
.595**
.000
.39
.751**
.000
.39
租云服务器三个月的数量
Person相关性显著性
N
.791**
.000
.38
.687**
.000
.39
.757**
.000
.39
1
.000
.39
.789**
.000
.39
租云服务器四个月的数量
Person相关性显著性
N
.632**
.000
.38
.560**
.000
.39
.757**
.000
.39
.595**
.000
.39
1
.000
.39
**表示在.01水平上的显著性
附表二:
模型汇总b
模型
R
R方
调整R方
标准估计的误差
Durbin-Watson
1
.993a
.985
.741
a表示预测变量,租云服务器一个月数量,租云服务器二个月数量,租云服务器三个月数量,租云服务器四个月数量
b表示因变量:
\成本
附表三:
Anovaa
模型
平方和
df
均方
F
Sig.
1回归
残差
总计
291862813.5
4110944.959
295975758.5
3
34
37
97287604.49
120910.147
804.628
.000b
a表示预测变量,租云服务器一个月数量,租云服务器二个月数量,租云服务器三个月数量,租云服务器四个月数量
b表示因变量:
\成本
附表四:
系数a
模型
非标准化系数
标准系数
t
Sig.
相关性
统计量
B
标准误差
试用版
零险
偏
VIF
1租云服务器一个月数量
租云服务器二个月数量
租云服务器三个月数量
租云服务器四个月数量
240.53
362.27
864.98
199.69
634.774
.0000228
1644.534
72.276
.601
.356
.103
.379
11.915
.103
2.749
.007
.000
.000
.009
.960
.958
.657
.898
.670
.426
6.228
11.213
3.461
a表示因变量:
\成本
附表四:
附表五
t分布表:
df
单尾检验的显著水平
0.050
0.025
0.010
0.005
双尾检验的显著水平
0.10
0.05
0.02
0.01
3
2.353
3.182
4.541
5.841
4
2.132
2.776
3.747
4.604
5
2.015
2.571
3.365
4.032
6
1.943
2.447
3.143
3.707
7
1.895
2.365
2.998
3.499
8
1.860
2.306
2.896
3.355
9
1.833
2.262
2.821
3.250
10
1.812
2.228
2.764
3.169
11
1.796
2.201
2.718
3.106
12
1.782
2.179
2.681
3.055
13
1.771
2.160
2.650
3.012
二、问题模型建立
(1)设第1至第4个月的租云服务器方案如下:
租期
1个月
2个月
3个月
4个月
第1个月
x1
x2
x3
x4
第2个月
x5
x6
x7
第3个月
x8
x9
第4个月
x10
其中,第一个月开始
长期租赁每月成本=600+8*5*4*20+5*4*100=5800(美元)
所以,最小成本问题模型如下:
Min4000*(x1+x5+x8+x10)+3700*(x2+x6+x9)+3225*(x3+x7)+3040*x4+(1+2+3+1)*5800
s.t.
x1+x2+x3+x4>=10-1;
x2+x3+x4+x5+x6+x7>=12-2;
x3+x4+x6+x7+x8+x9>=14-3;
x4+x7+x9+x10>=8-1;
x1≥0;
x2≥0;
x3≥0;
x4≥0;
x5≥0;
x6≥0;
x7≥0;
x8≥0;
x9≥0;
x10≥0;
用Lingo解得
Globaloptimalsolutionfound.
Objectivevalue:
74040.00
Infeasibilities:
0.000000
Totalsolveriterations:
1
VariableValueReducedCost
X10.0000004000.000
X50.0000004000.000
X80.000000960.0000
X100.0000004000.000
X20.0000003700.000
X60.000000660.0000
X90.000000660.0000
X30.000000185.0000
X70.000000185.0000
X411.000000.000000
RowSlackorSurplusDualPrice
174040.00-1.000000
22.0000000.000000
31.0000000.000000
40.000000-3040.000
54.0000000.000000
60.0000000.000000
70.0000000.000000
80.0000000.000000
911.000000.000000
100.0000000.000000
110.0000000.000000
120.0000000.000000
130.0000000.000000
140.0000000.000000
150.0000000.000000
由以上程序求解可知:
最优租赁方案为在第一个月租赁租期为4个月的货云服务器11辆。
最优租赁方案的成本为74040美元。
(2)设第1至第4个月的租云服务器方案如下:
租期
1个月
2个月
第1个月
x1
x2
第2个月
X3
云服务器长期租赁每月成本的花销可有计算得到=600+8*5*4*20+4*5*4*60+6*4*200=600+3200+4800+4800=13400(美元)
所以,最小成本问题模型如下:
Min4000*(x1+x2)+3700*(x3)+3*13400
最小成本问题模型存在的约束:
x1+x2>=26-1;
x2+x3>=12-2;
x1≥0;
x2≥0;
x3≥0;
用Lingo解得
Globaloptimalsolutionfound.
Objectivevalue:
128670.00
Infeasibilities:
0.000000
Totalsolveriterations:
1
VariableValueReducedCost
X10.0000004000.000
X20.0000003700.000
X321.000000185.0000
RowSlackorSurplusDualPrice
174040.00-1.000000
22.0000000.000000
31.0000000.000000
40.000000-3978.000
54.0000000.000000
由以上程序求解可知:
最优租赁方案为在第一个月租赁租期为2个月的货云服务器21辆。
最优租赁方案的成本为128670美元。
(4)为了更好地表达回归方程,这里我们假设因变量成本消费量是y,自变量租云服务器一个月数量,租云服务器二个月数量,租云服务器三个月数量,租云服务器四个月数量分别是:
x1,x2,x3,x4从系数表可以知道,自变量x1的系数是240.53,自变量x2的系数是362.27,自变量x3的系数是864.98,自变量x4的系数是199.69,
,那么回归方程可以表示为:
Y=240.53x1+362.27x2+864.98x3+199.69x4;
三、分析与建议
(3)对于Bob一直坚持的“不解雇”问题,涉及的内容比较复杂:
1.如果不考虑其他的条件,单纯就长期租赁和短期租赁相比,长期租赁的成本显然要高于短期租赁。
我们可以猜测,如果解雇针对的是长期租赁的坐守监视技术人员,那么公司多付出的资金就是长期租赁比短期租赁成本多出的部分。
2.如果短期租赁不考虑最小租赁成本,则有多种方案;长期租赁和短期租赁的配比也会随之变动。
难以确认准确的成本差。
Bob的要求并没有明确,是否需要短期租赁的云服务器去承担长期租赁开云服务器运行维护服务器的任务,所以同时也难以确认“解雇”针对的是哪一类型的员工。
就此而言,难以确认多付出的资金数额。
3.总体而言,应当根据最优方案来确认人员的雇用问题,如果短期租赁更节约成本,我们认为Bob没有坚持无谓的“不解雇”政策的必要。
(4)
1)从模型汇总表中可以看出来,R为0.993,可以的得到R^2=0.993^2=0.986;标准估计的误差理论上的计算是:
每个样本的值与实际对应的值的判别,但是,实际情况是实际值是不知道的,所以就可以用样本的平均值代替实际值,计算出来的结果就是样本的标准差,从Anova表中可以看出来,标准估计的误差为120910.147^(0.5)=347.72。
2)为了更好地表达回归方程,这里我们假设因变量成本消费量是y,自变量租云服务器一个月数量,租云服务器二个月数量,租云服务器三个月数量,租云服务器四个月数量分别是:
x1,x2,x3,x4从系数表可以知道,自变量x1的系数是240.53,自变量x2的系数是362.27,自变量x3的系数是864.98,自变量x4的系数是199.69,
,那么回归方程可以表示为:
Y=240.53x1+362.27x2+864.98x3+199.69x4;
3)第一个自变量租云服务器一个月数量的系数是240.53,数值比较大,对于项目总的消耗成本还是有比较大的影响;对于项目总的消耗成本有明显正相关的关系,也就是租云服务器一个月数量如果增加1台云服务器,那么项目总的消耗成本就会相应的提高240.53美元;第二个自变量租云服务器二个月数量的系数是362.27,数值比较大,而且是一个大于0的数,对于项目总的消耗成本有明显正相关的关系,也就是租云服务器一个月数量如果增加1台云服务器,那么项目总的消耗成本就会相应的提高362.27美元;第三个自变量租云服务器三个月数量的系数是864.98,数值比较大,而且是一个大于0的数,对于项目总的消耗成本有明显正相关的关系,也就是租云服务器一个月数量如果增加1台云服务器,那么项目总的消耗成本就会相应的提高864.98美元;对于项目的成本消耗是影响最大的一个因素;第四个自变量租云服务器三个月数量的系数是199.69,数值同样比较大,而且是一个大于0的数,对于项目总的消耗成本有明显正相关的关系,也就是租云服务器一个月数量如果增加1台云服务器,那么项目总的消耗成本就会相应的提高199.69美元;对于项目的成本消耗是影响相对较小的一个因素;同样从系数表中可以看出来sigx1=0.007,sigx2=0.000,sigx3=0.000,sigx3=0.009说明在显著性水平0.01的时候,几个自变量云服务器的租用的各个月的数量对于因变量项目成本的消耗的影响是一种显著为正的关系。
4)进行显著性检验进行显著性检验是为了消除第一类错误和第二类错误。
第一类错误:
通常情况下,α水平就是。
第一类错误是零假设为真却被错误拒绝的概率。
第二类错误:
是零假设为误却被错误接受的概率或是研究假设为真却被拒绝的概率。
如果P值小于某个事先确定的水平,理论上则拒绝零假设,反之,如果P值大于某个事先确定的水平,理论上则不拒绝零假设。
sig=0.000说明显著性水平p值小于0.001,即相关系数在0.001水平显著。
这里的0.000其实并不是说真的是等于0,如果你在这个数字上三击鼠标,可以看到真实值。
水平越小,判定显著性的证据就越充分,但是不拒绝错误零假设的风险,犯第二类错误的可能性就越大,统计效力(就越低。
选择水平不可避免地要在第一类错误和第二类错误之间做出权衡。
从Anova表中可以看出来,sig的数值是根据t统计量进而得到的概率值,也就是说t和sig两者是几乎等效的存在,那么对于sig来说,必须小于显著性水平,趋近于0是最好的。
F是检验方程显著性的统计量,数值越大越好。
从Anova表中可以看出来,回归模型统计值F=804.627,p值为0.000,可以得出表现回归极显著。
可以得出因变量y与三个自变量x1、x2、x3、x4之间存在线性关系。
并且从系数表中可以看出来,除除了第一个数也就是常数项系数的显著性水平>0.05,对于回归检验不影响,三个自变量x1、x2、x3、x4小于0.05,即每个回归系数均具有意义。
参考文献:
[1](美)安德森等著.侯文华等译.数据、模型与决策:
管理科学篇(原书第13版)[M].北京:
机械工业出版社,2012.
[2](美)戴维.安德森..商务与经济统计[M].北京:
机械工业出版社,2010.
[3]孙炎.应用统计学[M].北京:
机械工业出版社,2014.
[4]马良.高级运筹学[M].北京:
机械工业出版社,2008.
[5]朱平芳.现代计量经济学[M].上海:
上海财经大学出版社,2005.