多元统计分析课程论文Word文档下载推荐.docx
《多元统计分析课程论文Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《多元统计分析课程论文Word文档下载推荐.docx(25页珍藏版)》请在冰点文库上搜索。
北京
7467.8
2359.8
9497.7
2041.4
3578.6
3268.3
1914.2
975.2
31103
天津
7376.6
1859.3
4873
1295.5
2904.7
1833.8
1584.5
615.5
22342.9
河北
3263.7
971.8
2727.7
773.6
1749.3
1144.5
1027.5
273.5
11931.6
山西
2940.5
1084.8
2198.8
619.4
1214.7
1484.6
1008.6
312.4
10863.8
内蒙古
4746.4
1688
2795.2
1008.9
2405.1
1813.2
1319.7
481.5
16258
辽宁
4554.8
1477.8
3400.5
918.7
1949.7
1834.4
1419.2
512.9
16068
吉林
3531.6
1228.9
2561.3
689.5
1636.3
1550.8
1458
369.6
13026
黑龙江
3537.9
1292.8
2689.6
670.9
1588.4
1406.8
1258.3
324.1
12768.8
上海
9011.6
1613
10789.1
1531.6
3596.5
3311.4
2223.9
987.6
33064.7
江苏
5591.7
1385.2
4126.7
1107.2
2869.3
2238.2
1331.3
514
19163.6
浙江
6569.2
1587.1
5577.2
1117.7
3670.6
2169
1358.2
503.1
22552.1
安徽
4003.1
870.3
2541.8
694.2
1324.9
1157.3
870
265.3
11726.9
福建
6081.9
1097.5
4278.5
1032.3
2067
1667.2
926.8
493.1
17644.3
江西
3785.8
853.4
2576.6
679.3
1164.3
1151.1
635
243.4
11088.9
山东
3932.3
1168.9
2825.8
993.6
1821.9
1303
989.6
293.7
13328.8
河南
3202.4
1111.8
2208.6
875.1
1225.5
1160.8
929
287.1
11000.3
湖北
4139.7
1009.7
2810.2
813.4
1339.8
1479.8
1056.2
279.3
12928.1
湖南
4240.5
914.1
2708.4
796.9
1600.2
1764.9
972.2
291.4
13288.6
广东
6589.8
1014.6
4300.2
1116.5
2795.1
1965
890.5
533.9
19205.6
广西
3680.1
460.5
2341.5
614
1198.3
1115.3
185.3
10274.3
海南
4915
549.9
2558.2
686
1437.4
1358.4
716.8
248.8
12470.5
重庆
4971.9
1275.9
2554.4
978.8
1476.2
1319.3
966.1
268.1
13810.7
四川
4548.2
974.3
2217.3
879.6
1437
1061
964.5
286.5
12368.4
贵州
3151.9
666.3
1826.9
619.1
1080.4
1222
572
164.7
9303.3
云南
3211.5
567
2018.5
568.4
1513.6
1096.7
739.4
154.4
9869.5
西藏
3370.2
733.7
1311.5
399.7
796
266.7
197.6
241.5
7316.9
陕西
3405.1
944.6
2585.8
796.2
1535.4
1500.4
1178.2
257.9
12203.6
甘肃
3218.2
884.2
2015
652.1
1072.2
1092.4
737.2
203.3
9874.6
青海
3854.4
1153
2374.5
733.5
1790.1
1293
1071.2
335
12604.7
宁夏
3555.6
1170
2214.4
797.9
1763.5
1416.4
1239.9
326.7
12484.4
新疆
3855
1205.6
2226.4
669.2
1624.5
1102.2
978.3
242.4
11903.6
140304.4
35173.8
101731.3
27170.2
57226.5
47547.9
33213.2
11471.2
453838.5
表1.1.1可以看出上海、北京、天津,三个地区都是高消费地区,贵州、云南、西藏、甘肃都属于消费水平较低的地区,而其余地区基本属于中间消费段落,由于处于中间段落消费地区的城市也存在差距,之后会通过处理,具体再做说明。
比较显而易见的就是,食品烟酒占了消费支出的大部分,其余消费都基本没有太多显着变化。
需要说明的是,在北京,上海两地的居住消费支出都超过了食品烟酒的消费支出。
这在其他地区是不存在的。
1.1.2
维数
奇异值
惯量
卡方
Sig.
惯量比例
置信奇异值
解释
累积
标准差
相关
2
1
.106
.011
.427
.002
.019
.091
.008
.310
.737
.001
3
.051
.003
.099
.837
4
.049
.090
.927
5
.032
.038
.964
6
.025
.024
.989
7
.017
.000
1.000
总计
.027
12040.582
表1.1.2中可知,7个维度的奇异值分别为0.106、0.091、0.051、0.049、0.032、0.025、0.017;
惯量展示了行列关系的强度,7个维度的惯量分别为0.011、0.008、0.003、0.002、0.001、0.001、0.001,其中第一个惯量的值最大,意味着它解释各别差异的能力最强,地位最重要,其他惯量的重要性依次下降,惯量的总和为0.027;
卡方、显着性是对交叉列联表作卡方检验的卡方观测值(12040.582),认为行变量和列变量有显着的相关性关系;
惯量比例中的考虑情况展示了各个惯量的方差贡献率,第一个特征根的方差贡献率为0.427,方差贡献率是最高的,惯量累计就是各惯量的累计方差贡献率,由于前两个特征根就已经解释了各类别差异的73.7%,因此最终提取2个因子是可行的,信息丢失少,足够对数据进行描述。
1.1.3概述行点
概述行点a
质量
维中的得分
贡献
点对维惯量
维对点惯量
.069
-.601
.230
.232
.040
.773
.096
.870
.082
-.142
.098
.248
.346
.026
-.014
.240
.459
.460
.170
.467
.006
.058
.100
.647
.747
.036
.388
.271
.029
.572
.237
.810
.035
.298
.696
.786
.227
.520
.014
.086
.156
.693
.849
.028
.164
.408
.007
.052
.133
.705
.839
.073
-.784
-.011
.005
.421
.956
.042
-.003
.083
.079
.050
-.200
-.038
.214
.221
.080
-.178
.009
.118
.501
.618
.039
-.162
-.378
.010
.061
.171
.792
.963
-.033
-.264
.568
.579
.119
.004
.188
.104
.292
.235
.243
.013
.016
.285
.261
.545
.075
.015
.094
-.009
-.100
-.408
.078
.043
.611
.653
.023
-.080
-.398
.595
.070
-.611
.113
.012
.748
.759
.030
.366
-.228
.564
.187
.751
.372
-.283
.547
.270
.817
.020
.167
-.169
.154
.135
.289
.022
.088
-.121
.046
.074
.120
.454
-1.058
.031
.199
.130
.602
.732
.084
.325
.622
.670
.197
-.016
.463
.466
.278
.150
.665
.165
.830
.352
.484
.944
.356
.720
.733
有效总计
由表1.1.3可知,总惯量为0.27,各地区对总惯量的贡献度几乎接近0。
从贡献中的点对维惯量中可以看出,第一维度中主要反映了“北京”23.2%、“上海”42.1%,第二维度主要反映了“海南”11.3%,“西藏”19.9%;
从维对点惯量中可以看出,第一维度主要反映了“北京”77.3%,“内蒙古”57.2%,“上海”95.6%,“重庆”56.4%,“四川”54.7%,“青海”66.5%,“新疆”72.0%及其他类别,第二维度主要反映了“山西”64.7%,“辽宁”69.6%,“吉林”69.3%,“黑龙江”70.5%,“海南”74.8%,“西藏”60.2%,“陕西”62.2%及其他类别。
1.1.4概述列点
种类
0.309
0.19
-0.385
0.005
0.105
0.504
0.218
0.759
0.977
0.078
0.447
0.381
0.004
0.146
0.124
0.429
0.265
0.694
0.224
-0.566
0.016
0.008
0.674
0.001
0.981
0.982
生活品及服务
0.06
0.154
0.037
0.013
0.17
0.178
0.126
0.076
0.073
0.002
0.007
0.035
0.027
0.063
0.269
0.084
0.319
0.256
0.582
0.003
0.045
0.273
0.15
0.658
0.808
0.025
-0.2
0.14
0.009
0.144
0.061
0.205
由表1.1.4可知总惯量为0.27,各地区对总惯量的贡献相近且都接近于0。
从贡献中的点对维惯量中可以看出,第一维度主要反映了“衣着”14.6%,“居住”67.4%,以及其他类别,第二维度主要反映了“食品烟酒”52.1%及其他类别;
从维对点惯量中可以看出,第一维度主要反映了“衣着”42.9%,“居住”98.1%,“生活用品及服务”17.0%,“医疗保健”15.0%,“其他用品及服务”14.4%,第二维度主要反映了“食品烟酒”75.9%,“教育文化娱乐”31.9%,“医疗保健”65.8%。
上图为“维数1转换的地区类别图”是各个地区在第1个维度上的得分图,由图可知“西藏(26)”与“内蒙古(5)”的得分最高;
上图为“维数2转换的地区类别图”是地区在第2个维度上的得分图,由图可知“吉林”的得分最高;
上图为“维数1转换的种类类别图”是消费种类在第1个维度上的得分图,由图可知“衣着”类的得分最高;
上图为“维数2转换的种类类别图”是消费种类在第2个维度上的得分图,由图可知“医疗保健”类的得分最高;
如上图所示经过对数据的分析和简化,在图中可以清楚地看出来,各个地区的不同消费支出倾向,正如开始对数据简单观察上得出的结论,北京上海这两个地区的消费支出和居住有着密切关系,而其他地区并不是特别明显。
大部分地区的主要消费还是偏向于食品烟酒。
西藏的消费支出情况与其他地区明显不是一类。
(二)因子分析
1.2.1相关矩阵
.655
.889
.855
.880
.822
.676
.885
衣着_
.699
.832
.780
.745
.836
.825
.893
.859
.920
.797
.943
.862
.886
.782
.912
.791
.881
.867
.916
.843
表1.2.1为相关矩阵表,由表可知,8个指标之间存在着高度相关关系,其中居住和其他用品及服务的相关系数最大为0.943,衣着和食品烟酒的相关系数最小为0.655,各指标相关程度都十分高,因此可以进行因子分析。
1.2.2KMO和Bartlett的检验
KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.848
Bartlett的球形度检验
近似卡方
363.131
df
28
由表1.2.2可知,KMO值为0.848>
0.6,效度较高,通过了检验,Sig为0.000,因此可以进行因子分析。
1.2.3公因子方差
初始
提取
.936
.926
.938
.901
.884
.906
.902
.949
表1.2.3可知,这8个指标对所提取的公因子的依赖程度都大于0.8,可以看出所有指标对提取公因子的依赖程度都很高。
1.2.