原创SPSS基于聚类因子分析的大学生网购行为研究附代码数据.docx
《原创SPSS基于聚类因子分析的大学生网购行为研究附代码数据.docx》由会员分享,可在线阅读,更多相关《原创SPSS基于聚类因子分析的大学生网购行为研究附代码数据.docx(32页珍藏版)》请在冰点文库上搜索。
原创SPSS基于聚类因子分析的大学生网购行为研究附代码数据
大学生网络购物调查
首先在本问卷中,我们设定了两种类型,一种是单选题,一种是多选题。
每一个问题在这个数据表格的一列。
根据候选人的选择,每个选项的选择号码或内容分为两部分。
问卷选择分类方法。
主要分析方法如下:
样本描述统计:
主要通过频率分布表分析样本的样本总样本百分比,有效百分比,累积百分比。
数据由专业统计分析软件进行处理和分析。
直方图和饼图直观地表示每个变量状态的值。
因素分析:
通过解释变量之间的相关性来解释数据结构的方法。
因子分析通过将大量变量缩小为较小的一组潜在变量或因子将数据归结为几个维度。
在本文中,因子分析用于简化生活方式因素的维度,描述大学生的重要特征更简洁直观。
聚类分析:
k-means聚类是一种矢量量化的方法,最初来自于信号处理,在数据挖掘中受到聚类分析的欢迎。
交叉表和卡方检验,本文首先通过卡方检验,在显着性水平上,是否接受原始假设。
然后使用交叉表来显示不同类型的生活方式学生的在线购物行为差异。
用描述性统计
被调查学生性别统计:
男生67人,女生140人。
男女比例接近于1:
2。
频率
百分比
有效
男
67
32.4
女
140
67.6
合计
207
100.0
从性别比例的频数表格来看,女生有140个人,占比67.6%,男生为67个人占比32.4%。
因此被调查者中女生居多,男生偏少。
然后我们查看所有年级的比例
从饼图中我们可以看到,大四年级的学生占绝大多数,其次是大三学生。
频率
百分比
有效
大一
23
11.1
大二
37
17.9
大三
36
17.4
大四
111
53.6
合计
207
100.0
从频数的表格来看,可以发现大四学生为111个人占比53.6%大三学生有36个人占比17.4%,大二学生有37个人占比17.9%。
然后我们察看被调查者的月生活费情况。
行业生活费中我们可以看到,大部分被调查者的月生活费在1000元到两千元之间,然后是两千元到三千元之间。
频率
百分比
有效
1000元以下
28
13.5
1000-2000元
85
41.1
2000-3000元
55
26.6
3000-4000元
17
8.2
4000-5000元
7
3.4
5000元以上
15
7.2
合计
207
100.0
从表格来看,我们可以发现生活费在五千元以上的人有十五个人占比7.2%,月生活费在四千元到五千元,有七个人占比3.4%。
生活费在两千元到三千元的人有55个占比26.6%。
然后我们察看被调查者每月的网购频率
从图中我们可以看到网购频率在3到5次的人占绝大多数。
频率
百分比
有效
2次及以内
49
23.7
3-5次
88
42.5
6-8次
42
20.3
8次以上
28
13.5
合计
207
100.0
从表格来看,我们可以发现网购频率在八次以上有28个人,占比13.5%。
网购频率在6到8次之间的人有42个,占比20.3%。
网络频率在3到5次的人有88个占比42.5。
信度分析
可靠性是指如果测量重复多次,则刻度产生一致结果的程度。
可靠性分析称为可靠性分析。
可靠性分析是通过获得规模中系统变异的比例来确定的,这可以通过确定从不同的规模管理获得的分数之间的关联来进行。
因此,如果可靠性分析中的关联度较高,则规模产生一致的结果,因此是可靠的。
可靠性统计量
Cronbach'sAlpha
基于标准化项的CronbachsAlpha
项数
.852
.882
55
一般来说,我们认为信度系数在0.8左右,较好的可信程度。
从结果中我们可以看到系数在0.8左右,说明该调查有一定的可信度。
效度分析
有效性是概念,结论或测量是有根据的,与真实世界准确对应的程度。
“有效”一词来自拉丁语有效性,意思强。
测量工具的有效性(例如,在教育中的测试)被认为是工具衡量其所要衡量的程度;在这种情况下,有效性等同于准确性。
检验变量是否适合于因子分析的常用方法是巴特利特球形检验)和检验。
本文生活方式量表的因子分析前提条件检验情况如表
KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.621
Bartlett的球形度检验
近似卡方
3259.284
df
1485
Sig.
.000
表结果显示,球形度检验的近似卡方值为值为3259.28,小于说明原始矩阵不可能是单位阵,即原变量之间存在较高的相关性。
度量值为,综合以上两点的验证结果得出本问卷的数据适合做因子分析。
因子分析
因子分析是通过解释变量之间的相关性来解释数据结构的方法。
因子分析通过将大量变量缩小为较小的一组潜在变量或因子将数据归结为几个维度。
它通常用于社会科学,市场研究和其他使用大数据集的行业。
因子分析是一种用于根据较少数量的潜在不可观察(潜在)“因素”对观察变量及其协方差结构进行建模的方法。
这些因素通常被视为可能描述观察现象的广泛概念或观点。
例如,获得一定社会水平的基本愿望可能解释了大部分的消费行为。
这些不可观察的因素对社会科学家比观察到的定量测量更有趣。
因子分析通常是一种探索性/描述性的方法,需要用户许多主观判断。
它是一个广泛使用的工具,但可能是有争议的,因为模型,方法和主观性是如此灵活,可以发生关于解释的辩论。
该方法与主要组成部分相似,尽管教科书指出,因素分析更为精细。
在某种意义上,因子分析是主成分的反演。
在因子分析中,我们将观察到的变量建模为“因子”的线性函数。
在主成分中,我们创建新变量,这些变量是观察变量的线性组合。
但是在PCA和FA维度的数据都有所减少。
回想一下,在PCA中主要组成部分的解释往往不是很干净。
有时候,特定的变量可以显着地贡献于多于一个的组件。
理想情况下,我们喜欢每个变量只对一个组件作出重大贡献。
针对该目标采用称为因子旋转的技术。
涉及因素分析的领域的例子包括生理学,健康,智力,社会学,有时是生态学和其他领域。
为了使变量更好地适应因子分析的前提,我们需要根据调查结果净化初始变量。
常用的测量是变量的通用性(公因子方差),即单项对整体方差的贡献。
一般来说,需要初始变量来删除与变量不常用的变量,下一步是提取具有大于原始变量的变量共同性的因子。
公因子方差
初始
提取
您的性别
1.000
.769
您的年级
1.000
.670
您的月生活费大约是
1.000
.690
您每月网购频率
1.000
.608
您的购物网站获知渠道(朋友介绍)
1.000
.659
您的购物网站获知渠道(网络广告)
1.000
.546
您的购物网站获知渠道(电视广告)
1.000
.599
您的购物网站获知渠道(电台广告)
1.000
.719
您的购物网站获知渠道(报刊广告)
1.000
.650
您的购物网站获知渠道(上网浏览)
1.000
.746
您常用的购物网站(淘宝)
1.000
.629
您常用的购物网站(聚美优品)
1.000
.662
您常用的购物网站(京东)
1.000
.579
您常用的购物网站(当当网)
1.000
.623
您常用的购物网站(亚马逊)
1.000
.684
您常用的购物网站(闲鱼)
1.000
.529
您常用的购物网站(唯品会)
1.000
.585
您常用的购物网站(苏宁易购)
1.000
.595
您常用的购物网站(我买网)
1.000
.611
您常用的购物网站(聚划算)
1.000
.612
您每月网络购物的消费
1.000
.757
您网购的资金来源(父母家庭)
1.000
.718
您网购的资金来源(兼职零工)
1.000
.668
您网购的资金来源(生活补助)
1.000
.617
您网购的资金来源(奖学金)
1.000
.660
您选择网购的原因(方便快捷)
1.000
.689
您选择网购的原因(时尚潮流)
1.000
.586
您选择网购的原因(价格便宜)
1.000
.681
您选择网购的原因(多选择性)
1.000
.590
您选择网购的原因(商品更新快)
1.000
.643
您通常网购商品类型(学习用品)
1.000
.655
您通常网购商品类型(服装服饰)
1.000
.450
您通常网购商品类型(化妆品)
1.000
.700
您通常网购商品类型(电子产品)
1.000
.684
您通常网购商品类型(虚拟产品)
1.000
.733
您通常网购商品类型(食品保健品)
1.000
.649
您通常网购商品类型(体育用品)
1.000
.635
您通常网购商品类型(购票)
1.000
.553
您对网购担心的问题(付款安全性)
1.000
.533
您对网购担心的问题(网站诚信)
1.000
.637
您对网购担心的问题(商品质量)
1.000
.665
您对网购担心的问题(售后服务)
1.000
.698
您对网购担心的问题(配送问题)
1.000
.709
您对网购担心的问题(个人隐私泄露)
1.000
.583
您通常对网购问题的解决方式
1.000
.720
13、生活方式问题(喜欢和同学一起出去活动)
1.000
.623
13、生活方式问题(追求时尚新颖的产品)
1.000
.707
13、生活方式问题(会货比三家)
1.000
.629
13、生活方式问题(有风险的事情就不愿意做)
1.000
.539
13、生活方式问题(喜欢结实各类型朋友)
1.000
.617
13、生活方式问题(愿意购买广告广泛宣传产品)
1.000
.627
13、生活方式问题(喜欢购买便宜打折产品)
1.000
.674
13、生活方式问题(喜欢将来有份稳定工作,尽管收入不高)
1.000
.659
13、生活方式问题(流行和实用之间我选择流行)
1.000
.652
13、生活方式问题(花钱有计划性)
1.000
.642
提取方法:
主成份分析。
通过上述分析,使用主成分分析提取因子,最大旋转因子的方差为了得到上述因子负荷量表,根据提取标准,提取大于因子负荷的特征值绝对值大于该因子。
这个比例从问题的问题中删除“您通常网购商品类型(服装服饰)的问题”保持负载值大于0.5问题。
因素的数量通常使用指数或特征值来确定。
指数或特征值方法给出各个阶段的因子分析特征的根和方差贡献表,其中包括初始特征值,提取平方和负载,其中旋转正方形和负载,初始特征值列给出了初始样本相关系数矩阵或协方差矩阵的特征根,用于确定哪些因素应提取;
提取正方形和负载列给出提取的因子方差贡献率,旋转后提取的共同因子的方差贡献因子由因子的数量给出特征值是一个二维空间图,可以更直观地显示每个因子的分布。
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
4.230
7.691
7.691
4.230
7.691
7.691
2
3.771
6.856
14.547
3.771
6.856
14.547
3
3.562
6.477
21.024
3.562
6.477
21.024
4
2.713
4.933
25.957
2.713
4.933
25.957
5
2.526
4.593
30.550
2.526
4.593
30.550
6
1.981
3.601
34.151
1.981
3.601
34.151
7
1.789
3.253
37.404
1.789
3.253
37.404
8
1.708
3.106
40.510
1.708
3.106
40.510
9
1.587
2.886
43.396
1.587
2.886
43.396
10
1.528
2.777
46.173
1.528
2.777
46.173
11
1.429
2.599
48.772
1.429
2.599
48.772
12
1.396
2.538
51.310
1.396
2.538
51.310
13
1.331
2.420
53.730
1.331
2.420
53.730
14
1.296
2.356
56.087
1.296
2.356
56.087
15
1.219
2.216
58.302
1.219
2.216
58.302
16
1.137
2.067
60.369
1.137
2.067
60.369
17
1.095
1.992
62.361
1.095
1.992
62.361
18
1.046
1.901
64.263
1.046
1.901
64.263
19
.999
1.816
66.078
20
.968
1.760
67.838
21
.951
1.728
69.567
22
.897
1.630
71.197
23
.870
1.581
72.779
24
.847
1.540
74.319
25
.802
1.458
75.777
26
.776
1.411
77.187
27
.749
1.362
78.549
28
.727
1.322
79.871
29
.700
1.273
81.144
30
.673
1.223
82.367
31
.620
1.127
83.495
32
.602
1.094
84.589
33
.590
1.074
85.662
34
.566
1.028
86.691
35
.538
.979
87.669
36
.531
.966
88.635
37
.498
.905
89.541
38
.475
.865
90.405
39
.474
.862
91.267
40
.447
.813
92.080
41
.429
.780
92.860
42
.407
.740
93.600
43
.395
.718
94.318
44
.349
.634
94.952
45
.333
.605
95.558
46
.312
.567
96.125
47
.295
.537
96.662
48
.282
.512
97.174
49
.273
.496
97.671
50
.270
.491
98.162
51
.243
.443
98.604
52
.220
.400
99.004
53
.212
.385
99.389
54
.172
.312
99.701
55
.164
.299
100.000
提取方法:
主成份分析。
从上面的图可以看出,在第6个因子曲线出现明显的顶点,在第6个因子之前的曲线非常陡峭,而在第七个因子之后的曲线趋于平缓。
在特征根和方差贡献表中,第一个常用因子解释变量的总方差,第二个共同因素解释变量的总方差第三个常见因素解释变量的总方差,第四个共同因素解释变量总方差的第五个共同因素解释变量总方差的第六个方差公开因素解释变量的总方差,累积贡献率,6个因子可以是变量信息的良好代表。
主成分分析中,由该因素的最高负荷变量的数量减少以得到最终因素,如下表所示:
成份矩阵a
成份
1
2
3
4
5
6
7
8
9
您的购物网站获知渠道(朋友介绍)
.239
-.067
-.095
.258
-.155
-.305
.077
.179
.075
您的购物网站获知渠道(网络广告)
.268
.387
-.070
-.068
.162
-.231
-.014
.205
-.033
您的购物网站获知渠道(电视广告)
.271
.476
-.198
-.177
-.145
-.063
-.130
.035
-.086
您的购物网站获知渠道(电台广告)
.158
.607
-.050
-.290
.068
.006
-.134
.225
.066
您的购物网站获知渠道(报刊广告)
.289
.419
-.036
-.144
.155
-.247
.092
.080
-.168
您的购物网站获知渠道(上网浏览)
.206
-.242
.225
.229
.133
.232
.097
-.355
-.115
您常用的购物网站(淘宝)
.271
-.319
.048
.331
-.182
-.042
.189
.235
-.022
您常用的购物网站(聚美优品)
.230
.436
.034
-.204
-.177
-.154
.131
.174
-.118
您常用的购物网站(京东)
.036
.044
-.272
.141
.128
.375
.013
.182
.180
您常用的购物网站(当当网)
.063
.253
-.054
.108
.044
.041
-.186
-.013
-.057
您常用的购物网站(亚马逊)
-.013
.036
.079
.266
.473
-.094
-.325
.043
-.048
您常用的购物网站(闲鱼)
.317
.300
.071
-.175
.206
.110
.040
-.017
.093
您常用的购物网站(唯品会)
.235
.296
.022
.131
-.117
.124
.235
.300
-.114
您常用的购物网站(苏宁易购)
.256
.344
-.149
.043
.347
.102
.143
-.252
-.090
您常用的购物网站(我买网)
.082
-.048
-.135
-.021
-.059
.234
.387
-.109
.260
您常用的购物网站(聚划算)
.285
.163
-.014
.122
.000
.174
.320
-.157
-.266
您每月网络购物的消费
.237
-.217
.205
-.244
.369
-.040
-.053
-.145
.083
您网购的资金来源(父母家庭)
.137
-.272
.165
.130
.064
-.535
.146
.194
-.331
您网购的资金来源(兼职零工)
.266
.325
-.087
.020
-.244
.333
.099
-.076
.200
您网购的资金来源(生活补助)
.302
.336
-.251
.039
.179
.276
-.050
-.165
-.342
您网购的资金来源(奖学金)
.100
.157
-.145
.448
.054
.063
-.459
.060
-.246
您选择网购的原因(方便快捷)
.266
-.453
-.075
.357
-.022
-.205
.289
.148
.020
您选择网购的原因(时尚潮流)
.560
.170
.232
-.263
-.121
-.035
-.104
.062
-.040
您选择网购的原因(价格便宜)
.216
.117
-.053
.188
-.262
.218
-.241
.083
.086
您选择网购的原因(多选择性)
.415
-.106
.186
.206
.217
-.075
.078
.126
.158
您选择网购的原因(商品更新快)
.654
-.115
.264
.033
.047
.026
-.062
-.012
.132
您通常网购商品类型(学习用品)
.107
.197
-.128
.350
-.054
-.320
-.094
-.032
-.236
您通常网购商品类型(服装服饰)
.326
-.063
.324
-.013
-.170
.113
.010
.006
-.219
您通常网购商品类型(化妆品)
.418
.183
.522
-.089
-.360
-.102
-.078
.091
.054
您通常网购商品类型(电子产品)
.205
.105
-.241
.070
.369
.324
.137
.119
.101
您通常网购商品类型(虚拟产品)
-.011
.160
-.028
-.009
.486
-.010
.049
.150
.319
您通常网购商品类型(食品保健品)
.155
.051
.193
.179
.069
.162
.105
.169
.081
您通常网购商品类型(体育用品)
.094
.140
-.353
-.151
.411
.006
.124
.035
-.377
您通常网购商品类型(购票)
.338
.092
.016
.421
.091
-.059
-.165
-.231
.050
您对网购担心的问题(付款安全性)
.277
.275
-.067
.193
.035
-.250
.088
-.292
.241
您对网购担心的问题(网站诚信)
.292
.258
.068
.123
-.120
-.226
.207
-.158
.021
您对网购担心的问题(商品质量)
.101
-.048
.054
.235
-.059
.233
-.362
.338
.218
您对网购担心的问题(售后服务)
.358
.028
-.154
.134
.017
.088
.146
.130
.219