多元统计分析课程设计题目样本.docx
《多元统计分析课程设计题目样本.docx》由会员分享,可在线阅读,更多相关《多元统计分析课程设计题目样本.docx(17页珍藏版)》请在冰点文库上搜索。
![多元统计分析课程设计题目样本.docx](https://file1.bingdoc.com/fileroot1/2023-5/26/b088f7be-bc7f-4741-9e65-0686190a182e/b088f7be-bc7f-4741-9e65-0686190a182e1.gif)
多元统计分析课程设计题目样本
课程设计题目
1.下表给出了1991年国内30个省、区、市城乡居民月平均消费数据,所考
察八个指标如下(单位均为元/人)
X1:
人均粮食支出;X2:
人均副食支出;
X3:
人均烟酒茶支出;X4:
人均其她副食支出;
X5:
人均衣着商品支出;X6:
人均日用品支出;
X7:
人均燃料支出;X8:
人均非商品支出;
问题:
(1)求样品有关系数矩阵R;
(2)从R出发做主成分分析,求各主成分贡献率,及前两个主成分累积贡献率;
(3)求出前两个主成分并解释其意义.按第一主成分将30个省、区、市排序,成果如何?
表一1991年国内30个省、区、市城乡居民月平均消费数据
省市
X1
X2
X3
X4
X5
X6
X7
X8
1
山西
8.35
23.53
7.51
8.62
17.42
10.00
1.04
11.21
2
内蒙古
9.25
23.75
6.61
9.19
17.77
10.48
1.72
10.51
3
吉林
8.19
30.50
4.72
9.78
16.28
7.60
2.52
10.32
4
黑龙江
7.73
29.20
5.42
9.43
19.29
8.49
2.52
10.00
5
河南
9.42
27.93
8.20
8.14
16.17
9.42
1.55
9.76
6
甘肃
9.16
27.98
9.01
9.32
15.99
9.10
1.82
11.35
7
青海
10.06
28.64
10.52
10.05
16.18
8.39
1.96
10.81
8
河北
9.09
28.12
7.40
9.62
17.26
11.12
2.49
12.65
9
陕西
9.41
28.20
5.77
10.80
16.36
11.56
1.53
12.17
10
宁夏
8.70
28.12
7.21
10.53
19.45
13.30
1.66
11.96
11
新疆
6.93
29.85
4.54
9.49
16.62
10.65
1.88
13.61
12
湖北
8.67
36.05
7.31
7.75
16.67
11.68
2.38
12.88
13
云南
9.98
37.69
7.01
8.94
16.15
11.08
0.83
11.67
14
湖南
6.77
38.69
6.01
8.82
14.79
11.44
1.74
13.23
15
安徽
8.14
37.75
9.61
8.49
13.15
9.76
1.28
11.28
16
贵州
7.67
35.71
8.04
8.31
15.13
7.76
1.41
13.25
17
辽宁
7.90
39.77
8.49
12.94
19.27
11.05
2.04
13.29
18
四川
7.18
40.91
7.32
8.94
17.60
12.75
1.14
14.80
19
山东
8.82
33.70
7.59
10.98
18.82
14.73
1.78
10.10
20
江西
6.25
35.02
4.72
6.28
10.03
7.15
1.93
10.39
21
福建
10.60
52.41
7.70
9.98
12.53
11.70
2.31
14.69
22
广西
7.27
52.65
3.84
9.16
13.03
15.26
1.98
14.57
23
海南
13.45
55.85
5.50
7.45
9.55
9.52
2.21
16.30
24
天津
10.85
44.68
7.32
14.51
17.13
12.08
1.26
11.57
25
江苏
7.21
45.79
7.66
10.36
16.56
12.86
2.25
11.69
26
浙江
7.68
50.37
11.35
13.30
19.25
14.59
2.75
14.87
27
北京
7.78
48.44
8.00
20.51
22.12
15.73
1.15
16.61
28
西藏
7.94
39.65
20.97
20.82
22.52
12.41
1.75
7.90
29
上海
8.28
64.34
8.00
22.22
20.06
15.12
0.72
22.89
30
广东
12.47
76.39
5.52
11.24
14.52
22.00
5.46
25.50
2.下表是49位女性在空腹状况下三个不同步刻血糖含量(用X1,X2,X3表达)
和摄入等量食糖一小时后三个时刻血糖含量(用小X4,X5,X6表达)观测值(单位:
mg/100ml).
问题:
分别从样本协方差阵S和样本有关系数矩阵R出发做主成分分析,求主成分贡献率和各个主成分.在两种状况下,你以为应保存几种主成分?
其意义如何解释?
就此而言,你以为基于S和R分析那个成果更为合理?
表二49位女性在空腹和摄入食糖后三个不同步刻血糖含量
编号
空腹
摄入食糖
X1
X2
X3
X4
X5
X6
1
60
69
62
97
69
98
2
56
53
84
103
78
107
3
80
69
76
66
99
130
4
55
80
90
80
85
114
5
62
75
68
116
130
91
6
74
64
70
109
101
103
7
64
71
66
77
102
130
8
73
70
64
115
110
109
9
68
67
75
76
85
119
10
69
82
74
72
133
127
11
60
67
61
130
134
121
12
70
74
78
150
158
100
13
66
74
78
150
131
142
14
83
70
74
99
98
105
15
68
66
90
119
85
109
16
78
63
75
164
98
138
17
103
77
77
160
117
121
18
77
68
74
144
71
153
19
66
77
68
77
82
89
20
70
70
72
114
93
122
21
75
65
71
77
70
109
22
91
74
93
118
115
150
23
66
75
73
170
147
121
24
75
82
76
153
132
115
25
74
71
66
143
105
100
26
76
70
64
114
113
129
27
74
90
86
73
106
116
28
74
77
80
116
81
77
29
67
71
69
63
87
70
30
78
75
80
105
132
80
31
64
66
71
83
94
133
32
71
80
76
81
87
86
33
63
75
73
120
89
59
34
90
103
74
107
109
101
35
60
76
61
99
111
98
36
48
77
75
113
124
97
37
66
93
97
136
112
122
38
74
70
76
109
88
105
39
60
74
71
72
90
71
40
63
75
66
130
101
90
41
66
80
86
130
117
144
42
77
67
74
83
92
107
43
70
67
100
150
142
146
44
73
76
81
119
120
119
45
78
90
77
122
155
149
46
73
68
80
102
90
122
47
72
83
68
104
69
96
48
65
60
70
119
94
89
49
52
70
76
92
94
100
3.考察1985年至全国如下各价格指数:
X1:
商品零售价格指数;
X2:
居民消费价格指数;
X3:
都市居民消费价格指数;
X4:
农村居民消费价格指数;
X5:
农产品收购价格指数;
X6:
农村工业品零售价格指数;
观测数据见下表.
问题:
按年份用下列办法进行系统聚类分析,画出谱系聚类图,并给出聚为3类
成果.
(a)最短距离法;(b)最长距离法;(c)类平均距离法;
表三全国各年度各种价格指数
年份
X1
X2
X3
X4
X5
X6
1985
128.1
100.0
134.2
100.0
166.8
111.1
1986
135.8
106.5
143.6
106.1
177.5
114.7
1987
145.7
114.3
156.2
112.7
198.8
120.2
1988
172.7
135.8
188.5
132.4
244.5
138.5
1989
203.4
160.2
219.2
157.9
281.2
164.4
1990
207.7
162.2
222.0
165.1
273.9
172.0
1991
213.7
170.8
233.3
168.9
268.4
177.2
1992
225.7
181.7
253.4
176.8
277.5
182.7
1993
254.9
208.4
294.2
201.0
314.7
204.3
1994
310.2
258.6
367.8
248.0
440.3
239.4
1995
356.1
302.8
429.6
291.4
527.9
274.6
1996
377.8
327.9
467.4
314.4
550.1
291.6
1997
380.8
337.1
481.9
322.3
525.3
294.8
1998
370.9
334.4
479.0
319.1
483.3
288.3
1999
359.8
329.7
472.8
314.3
424.3
280.5
354.4
331.0
476.6
314.0
409.0
277.1
4.考察1985年至全国如下各价格指数:
X1:
商品零售价格指数;
X2:
居民消费价格指数;
X3:
都市居民消费价格指数;
X4:
农村居民消费价格指数;
X5:
农产品收购价格指数;
X6:
农村工业品零售价格指数;
观测数据见下表.
问题:
先将数据原则化,再按年份用下列办法进行系统聚类分析,画出谱系聚类图,并给出聚为3类成果.
(a)最短距离法;(b)最长距离法;(c)重心距离法.
表四全国各年度各种价格指数
年份
X1
X2
X3
X4
X5
X6
1985
128.1
100.0
134.2
100.0
166.8
111.1
1986
135.8
106.5
143.6
106.1
177.5
114.7
1987
145.7
114.3
156.2
112.7
198.8
120.2
1988
172.7
135.8
188.5
132.4
244.5
138.5
1989
203.4
160.2
219.2
157.9
281.2
164.4
1990
207.7
162.2
222.0
165.1
273.9
172.0
1991
213.7
170.8
233.3
168.9
268.4
177.2
1992
225.7
181.7
253.4
176.8
277.5
182.7
1993
254.9
208.4
294.2
201.0
314.7
204.3
1994
310.2
258.6
367.8
248.0
440.3
239.4
1995
356.1
302.8
429.6
291.4
527.9
274.6
1996
377.8
327.9
467.4
314.4
550.1
291.6
1997
380.8
337.1
481.9
322.3
525.3
294.8
1998
370.9
334.4
479.0
319.1
483.3
288.3
1999
359.8
329.7
472.8
314.3
424.3
280.5
354.4
331.0
476.6
314.0
409.0
277.1
5.研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)。
居民非商品支出x3(亿元)关系。
数据见表。
编号
货运总量
y(万吨)
工业总产值x1(亿元)
农业总产值x2(亿元)
居民非商品支出x3(亿元)
1
160
70
35
1.0
2
260
75
40
2.4
3
210
65
40
2.0
4
265
74
42
3.0
5
240
72
38
1.2
6
220
68
45
1.5
7
275
78
42
4.0
8
160
66
36
2.0
9
275
70
44
3.2
10
250
65
42
3.0
(1)计算出y,x1,x2,x3有关系数矩阵;
(2)求y关于x1,x2,x3三元线性回归方程;
(3)对回归方程作明显性检查;
(4)对每一种回归系数作明显性检查;
(5)如果有回归系数没通过明显性检查,将其剔除,重新建立回归方程,再作回归方程明显性检查和回归系数明显性检查;
(6)当x1、x2、x3值为:
68,43,2.5时,试对货运总量作出预测。
6.某科学基金会管理人员欲理解从事研究工作数学家年工资额y与她们研究成果(论文、著作等)质量指标x1、从事研究工作时间x2,以及能成功获得资助指标x3之间关系。
为此,按一定设计方案调查了24位此类型数学家,得数据见下表。
编号
y
x1
x2
x3
1
33.2
3.5
9
6.1
2
40.3
5.3
20
6.4
3
38.7
5.1
18
7.4
4
46.8
5.8
33
6.7
5
41.4
4.2
31
7.5
6
37.5
6.0
13
5.9
7
39.0
6.8
25
6.0
8
40.7
5.5
30
4.0
9
30.1
3.1
5
5.8
10
52.9
7.2
47
8.3
11
38.2
4.5
25
5.0
12
31.8
4.9
11
6.4
13
43.3
8.0
23
7.6
14
44.1
5.6
35
7.0
15
42.8
6.6
39
5.0
16
33.6
3.7
21
4.4
17
34.2
6.2
7
5.5
18
48.0
7.0
40
7.0
19
38.0
4.0
35
6.0
20
35.9
4.5
23
3.5
21
40.4
5.9
33
4.9
22
36.8
5.6
27
4.3
23
45.2
4.8
34
8.0
24
35.1
3.9
15
5.0
(1)计算出y,x1,x2,x3有关系数矩阵;
(2)求y关于x1,x2,x3三元线性回归方程;
(3)对回归方程作明显性检查;
(4)对每一种回归系数作明显性检查;
(5)如果有回归系数没通过明显性检查,将其剔除,重新建立回归方程,再作回归方程明显性检查和回归系数明显性检查;
(6)假设某位数学家关于x1、x2、x3值为:
5.1,20,7.2,试预测她得年工资额。
7.在某地区抽取了14块岩石标本,其中7块含矿,7块不含矿。
每块岩石测定了Cu,Ag,Bi三种化学成分,数据如下:
含
矿
编号
Cu
Ag
Bi
1
2.58
0.90
0.95
2
2.90
1.23
1.00
3
3.55
1.15
1.00
4
2.35
1.15
0.79
5
3.54
1.85
0.79
6
2.70
2.23
1.30
7
2.70
1.70
0.48
不
含
矿
1
2.25
1.98
1.06
2
2.16
1.80
1.06
3
2.33
1.74
1.10
4
1.96
1.48
1.04
5
1.94
1.40
1.00
6
3.00
1.30
1.00
7
2.78
1.70
1.48
(1)生成SAS数据集;
(2)用DISCRIM程序进行鉴别分析(假定先验概率相等,两类样本协差阵相等);
(3)在明显性水平
下讨论已知类型两组公司特性与否有明显差别;
(4)写出距离鉴别线性鉴别函数;
(5)当前取一块岩石标本测得Cu、Ag、Bi分别为:
2.95、2.15和1.54,试鉴别这块岩石标本是含矿还是不含矿,并记录已知类别样品错判概率。
8.为了研究中小公司破产模型,选定4个经济指标:
X1总负债率(钞票收益/总负债)、X2收益性指标(纯收入/总财产)、X3短期支付能力(流动资产/流动负债)、X4生产效率性指标(流动资产/纯销售额)。
对17个破产公司(1类)和21个正常运营公司(2类)进行了调查,调查资料下表,试对这些指标作鉴别分析。
(1)生成SAS数据集;
(2)用DISCRIM程序进行鉴别分析(假定先验概率相等,两类样本协差阵相等);
(3)在明显性水平
讨论已知类型两组公司特性与否有明显差别;
(4)写出距离鉴别线性鉴别函数;
(5)运用后验概率对8个待判公司(*)进行鉴别归类,并记录已知类别样品错判概率。
(注:
将下列图片数据转换成表格数据)
9.表1中1995年到国内国民经济数据(数据来自于中华人民共和国记录年鉴),通过典型有关分析来来找出邮电业和国民经济之间互相影响内在规律,依照这个规律,给决策者提供一种当前如何发展邮电业参照。
采用如下指标来衡量国内各年份邮电业:
:
函件(亿件)
:
快递(万件)
:
移动电话年末顾客(万户)
:
固定电话年末顾客(万户),
采用下面指标来衡量国内各年份经济(单位都是万亿)
:
第一产业
:
工业
:
建筑业
:
第三产业
(1)生成SAS数据集;
(2)数据预解决;
(3)在明显性水平
讨论已知类型两组特性数据与否有明显差别;
(4)给出典型有关变量;
(5)给出典型有关系数;
(6)给决策者提供一种当前如何发展邮电业参照。
年份
1995
79.55
5562.7
362.9
4070.6
12135.8
24950.6
3728.8
19978.5
1996
78.68
7096.6
685.3
5494.7
14015.4
29447.6
4387.4
23326.2
1997
68.55
6878.9
1323.3
7031.0
14441.9
32921.4
4621.6
26988.1
1998
65.51
7331.8
2386.3
8742.1
14817.6
34018.4
4985.8
30580.5
1999
60.52
9091.3
4329.6
10871.6
14770.0
35861.5
5172.1
33873.4
77.71
11031.4
8453.3
14482.9
14944.7
40033.6
5522.3
38714.0
86.93
12652.7
14522.2
18036.8
15781.3
43580.6
5931.7
44361.6
106.01
14036.2
20600.5
21422.2
16537.0
47431.3
6465.5
49898.9
103.84
17237.8
26995.3
26274.7
17381.7
54945.5
7490.8
56004.7
82.81
19771.9
33482.4
31175.6
21412.7
65210.0
8694.3
64561.3
73.51
22880.3
39340.6
35044.5
22420.0
77230.8
10133.8
73432.9
71.31
26988.0
46105.8
36778.6
24040.0
91310.9
11851.1
84721.4
69.50
19.6
54730.6
36563.7
28095.0
107367.2
14014.1
100053.5
10.自1990年12月上海证券交易所和深圳证券交易所先后挂牌交易以来,中华人民共和国证券市场走过了近十七个年头,证券市场已经成为中华人民共和国经济生活重要构成某些,是中华人民共和国经济发展重要推动力量。
表1为收集金融上市公司所发布各年份利润及资产负债数据。
试用因子分析对金融上市公司在一定期期经营绩效优劣限度进行系统分析。
(1)生成SAS数据集;
(2)数据预解决;
(3)计算原始变量有关系数阵以及提取因子特性值、特性向量、各个因子贡献率及合计贡献率;
(4)对成果进行分析:
依照各因子得分以及她们排名,来评价一下这些上市公司经营状况,给决策者提供一种当前公