《统计学》案例综合分析.docx
《《统计学》案例综合分析.docx》由会员分享,可在线阅读,更多相关《《统计学》案例综合分析.docx(9页珍藏版)》请在冰点文库上搜索。
《统计学》案例综合分析
《统计学》案例——综合分析
关于居民月收入和居民金融资产影响因素关系的调查
1、问题的提出
改革开放以来。
中国居民家庭财富的效量不断增长。
居民储蓄存款持续稳定的增加。
从1978年的210.6亿元一路攀升,到2008年已达217885.4亿元。
在三十年的时间里增加了一千多倍。
与此同时,经济的货币化程度大大提高,金融市场特别是资本市场得到发展,使得居民金融资产选择的空同逐步扩大,导致了家庭金融资产多样化。
影响家庭金融资产组合的主要因素家庭金融资产选择主要受三类因素的影响:
l、家庭内部因素(收入水平以及家庭财务状况;家庭的特征:
成员的性别、年龄、婚姻状况、受教育程度、职业、健康状况、以及家庭人口数等;家庭成员的风险厌恶程度;住房所有权)。
2、金融资产特性随着资本市场的发展。
3、经济金融环境。
这些影响因素对居民金融资产的影响程度到底孰重孰轻呢?
2、数据的收集
为确定各类因素对居民金融资产的大小影响,有效地解居民关于金融资产和有关因素的现状,做了以下调查。
随机抽取了64户温州居民代表,以下为64位家庭各行业月收入和家庭金融资产(各种储蓄、有价证券、手存现金等)资料。
表1温州64位家庭各行业月收入和家庭金融资产信息表
表1是一个样本总体,由随机抽取的64户居民家庭组成,总体则是温州市的全体居民家庭。
从这64户家庭中所调查登记的月收入和金融资产的具体数据是标志值。
3、方法的确定
3.1.按标志对数据分组
对这64户的调查资料进行整理,按月收入和金融资产两标志进行分组。
对于按月收入进行分组整理的结果见表2。
表2.
按月收入分组(元)
户数
月收入(元)
金融资产(万元)
甲
(1)
(2)
(3)
500以下
3
1466
2.95
500-1000
6
4125
8.93
1000-1500
13
16556
33.43
1500-2500
21
40278
106.34
2500-3500
15
42724
155.31
3500以上
6
22945
87.20
合计
64
128094
394.16
表2中的各组和总体的“户数”是单位总量,各组和总体的“月收入”、“金融资产”是标志总量,它们是反映总体综合数量特征的指标。
对原始数据进行因果依存关系分组,见表3。
“户均金融资产”,它表明家庭金融资产随家庭月收入的增加而增加,属于“质量指标”。
“月收入”为因,金融资产是果。
表3.
按月收入分组(元)
户数
月收入(元)
金融资产(万元)
甲
(1)
(2)
(3)
500以下
3
2.95
0.98
500-1000
6
8.93
1.49
1000-1500
13
33.43
2.57
1500-2500
21
106.34
5.06
2500-3500
15
155.31
10.35
3500以上
6
87.20
14.53
合计
64
394.16
6.16
分别计算单位总量和标志总量的相对指标比重,并进行向上累计,得到下面的资料如表4所示。
以各组的户数比重与相对应的月收入、金融资产所占比重进行比较,可反映这两标志分布的均匀程度和集中状况。
表4.
按月收入分组
(元)
户数
月收入(元)
金融资产(万元)
比重(%)
比重累计(%)
比重(%)
比重累计(%)
比重(%)
比重累计(%)
甲
(1)
(2)
(3)
(4)
(5)
(6)
500以下
4.7
4.7
1.1
1.1
0.7
0.7
500-1000
9.4
14.1
3.2
4.3
2.3
3.0
1000-1500
20.3
34.4
12.9
17.2
8.5
11.5
1500-2500
32.8
67.2
31.5
48.7
27.8
39.3
2500-3500
23.4
90.6
33.4
82.1
38.6
77.9
3500以上
9.4
100.0
17.9
100.0
22.1
100.0
合计
100
-
100
-
100
-
3.2平均分析与变异分析平均数与均方差计算:
说明家庭金融资产拥有量的差异,比月收入水平的差异相对较大。
此统计数据的中位数是在第32户和33户之间,其中月收入在1.500~2.500元的分组中,把该组月收入按序排列,确定中位数为:
1/2*(1885+1990)=2082
月收入差异相对较小,为适度的偏态分布,按皮尔生经验公式2(x-xrne)=Xme-x。
来推算:
3.3.相关与回归分析
总体单位具有的各种数量标志是互相联系的。
家庭月收入与金融资产两标志既相关又回归。
计算相关和回归分析的指标如下:
=1.93
协方差值为正,表示月收入与金融资产两指标为正相关。
相关系数为0.905,反映这两指标高度正相关,用直线拟合两者的关系是合适的。
回归系数为0.0043,也体现出两指标正相关,表示家庭月收入每增加1元,金融资产平均增加43元。
估计标准误,表示以金融资产估计值来代表实际值平均来说有1.93万元的误差,反映月收入对金融资产的回归方程的代表性。
3.4.抽样推断——估计与检验
3.4.1抽样估计
1.户均月收入估计:
即范围是(1764,2239),即估计改城市户均收入在(1764,2239)元之间,可信度为95.45%。
2.户均金融资产估计:
即范围是(5.03,7.29),即估计改成是均金融资产在5.03万元至7.29万元之间。
可信度为95.45%。
3.月收入与金融资产两指标相关系数的估计:
相关系数的抽样平均误差
即范围是(0.86,0.95),
即以95.45%的置信度估计该城市月收入和金融资产的相关系数在(0.86,0.95)之间。
居民家庭月收入对金融资产的回归系数的区间估计
大回归系数b的抽样分布接近于正态分布,其抽样平均误差:
即范围是(0.0031338,0.0054662)
即以95%的置信度估计该城市居民家庭月收入每增加1元,金融资产平均增加31~55元。
5.月收入与金融资产回归分析中的“总体Y值”估计
已有:
假定,x0=2000,得到yc0=a+bx0=-2.456+0.443*2000=6.154
抽样平均误差:
这里的估计标准误差误Syx是按n-2即(64-2)的自由度计算的。
假定Z=1.96,则
即范围为(2.324,9.984)
即以95%的把握断定,凡是范月收入为2000元家庭的金融资产都不会达到10万元。
3.4.2假设检验
1.月收入和金融资产相关系数的假定检验即总体相关系数是否为零的检验。
已知相关系数抽样平均误差为0.0226,则
假定α=10%,双侧检验。
由标准正态分布表查到Z的临界值:
Z1=-1.65;Z2=-1.65,由于Z>Z0.05(40.44>1.65)。
故拒绝原假设。
此样本并非来自于
的总体,说明该城市总体家庭月收入(X)与金融资产(Y)相关系数显著。
2.金融资产在月收入上回归系数的检验
抽样平均误差
标准正态分布,以β为中心,故β=0
给定a=0.05,z的表上值为1.96,说明总体回归系数80是不可能的,b=0.0043是显著的,所以样本回归系数b不是来自t3=0的总体。
说明该城市家庭月收入与金融资产存在线性关系。
3.月收入与金融资产之间有明显线性关系的检验
F检验的实质是回归方差与剩余方差的比较,分析它们之间的差别是否显著,差别显著,说明两指标之间存在线性关系,反之则不存在。
这里,F=(4.52*4.52)/(64*950.72)=277.55
在1的显著水平下,按自由度1和62,查F之指为7左右,而计算出来的F值为277.55,远大于7,即F检验表明家庭月收入与融资资产之间明显存在线性关系。
4、结果分析
根据上述数据结果表明:
居民可支配收入是影响居民金融资产增长的主要因素。
近十年来,我国居民消费低于经济增长和居民可支配收入的平稳增长,是我国居民金融资产稳定增长的主要原因,但居民消费增速减慢加速了金融资产的增长,而居民可支配收入增幅的放缓又抑制了居民金融资产的快速增长。