统计学案例上市公司年报数据分析.doc
《统计学案例上市公司年报数据分析.doc》由会员分享,可在线阅读,更多相关《统计学案例上市公司年报数据分析.doc(20页珍藏版)》请在冰点文库上搜索。
![统计学案例上市公司年报数据分析.doc](https://file1.bingdoc.com/fileroot1/2023-5/1/0d782083-0581-4d96-84a0-2feecb750fe6/0d782083-0581-4d96-84a0-2feecb750fe61.gif)
统计教学案例二
上市公司年报数据分析案例
经统计调查取得数据后,需要通过统计整理、综合指标计算与相关回归分析等方法技术对总体数据进行处理,以认识总体变量分布状态(如正态分布)、特征表现(如结构相对数、平均数和标准差)、相关关系(如相关系数)和变化规律(如回归模型),从而了解事物或现象的本质及其依存因素。
其中统计整理技术包括总量指标、相对指标、平均指标和标志变异指标的揭示,他们的计算既是对总体基本特征的描述,又是对事物或现象进一步定量研究的基础;相关和回归是研究总体各事物或现象间相互关系的定量分析,用以测定不同特征相互联系的紧密程度,揭示变化形式和规律。
本章案例主要通过对总体静态数据处理过程的介绍,帮助读者掌握统计整理、指标描述和相关回归分析技术结合运用的技术与经验。
本章由1个大型案例构成,案例以沪深股市制造业上市公司为对象,系统介绍了静态数据总体的统计处理过程,包括分布描述、分类研究和相关因素分析。
上市公司年报数据分析案例的教学目的:
数据整理是统计分析的基础工作,在总体规模很大,数据量浩瀚、分布未知的情况下,如何对总体数据进行整理分类,描述总体分布及进一步分析总体各特征间的相互关系是对总体正确认识的关键。
由于具体的工作过程与教科书的知识点讲授顺序并不完全一致,因此本案例通过对1999年沪深股市制造业上市公司年报数据分析过程的介绍,给读者以处理总体静态数据的思路和技巧,从而训练读者解决实际问题的能力。
案例的背景分析与数据资料
一、案例的现实意义
上市公司的经营业绩与其股票价格、市场价值息息相关,因此反映上市公司经营业绩的定期公开披露的中期会计报告、年度会计报告就成为社会各界密切关注的重要信息之一。
对所有上市公司的财务报告进行统计整理和分析,把握上市公司整体的经营状况、经营业绩的水平和变化趋势,无论是对投资选择,还是政府的决策与监督,都是不可或缺的。
本案例探讨的就是面对大量的财务报告数据信息如何进行统计整理与分析,这对于投资者、投资咨询人员或是理论界研究者,都具有实际的指导意义。
通过本案例的学习讨论,有助于大家掌握统计描述和相关回归分析的方法,同时积累应用这些方法的实际经验和教训。
二、案例所依托的总体及其现状与研究目的
(一)案例所依托的客体
本案例所依托的客体是1999年上市公司年报中的有关财务指标。
1999年末,沪、深两市共有上市公司949家。
这些上市公司分布在13个行业部门。
根据中国证监会的《上市公司分类指引》中规定的分类方法,其中制造业共有578家,占60.91%。
总股本1938亿元,占62.73%,制造业是上市公司最集中的行业。
截止2000年4月30日,已公布年报的有560家。
所以本案例研究的总体范围确定为如期公布年报的制造业560家上市公司。
(二)案例研究的目的与任务
1.上市公司年报财务数据统计分析的目的
通过对制造业1999年报有关数据进行系统的统计整理、描述和回归分析,揭示1999年制造业上市公司主要财务指标的总体分布、分行业的经营业绩水平和重要特征,从中掌握认识总体分布特征和数量变化的技巧和方法,提高用统计思想和方法解决实际问题的能力。
2.上市公司年报财务数据统计分析的任务
对纷繁的数据进行不同的分类、分组、汇总、综合、分析、归纳、推断,显示上市公司财务报告中的主要财务指标的分布形态和主要特性,寻找财务指标之间的相互关系和表现规律。
3.上市公司年报财务数据统计分析的对象
本案例所引用资料取自《上海证券报》,包括了制造业560家上市公司。
共选有8个财务指标:
总资产、净利润、主营业务收入、股东权益、每股收益、每股净资产和股东权益比率。
其中,前4个为反映资产、收益方面的总量指标,后4个为反映盈利能力、业绩水平的相对指标。
4.数据的初步分析——制造业上市公司行业结构
在制造业中,生产不同产品的企业或公司,具有不同的规模,占有不等的资源要素,他们的总股本、净利润、净资产收益率必然存在很大的差异。
为了深入认识总体,首先要对制造业按其经济活动的特点进行行业分类。
根据《上市公司分类指引》,制造业进一步分为10个行业种类,编码为C0、C1、C2、…、C9。
分类统计属于定名测定。
从上述资料经计数整理后即可得到如表一的分布数列。
表2—1制造业上市公司行业分布
代码
行业分类
上市公司数
比重(%)
C0
食品、饮料
48
8.57
C1
纺织、服装、皮毛
45
8.04
C2
木材、家具
2
0.36
C3
造纸、印刷
16
2.86
C4
石油、化学
130
23.21
C5
橡胶、塑料
10
1.79
C6
金属、非金属
96
17.14
C7
机械、仪表、设备
151
26.96
C8
通讯、电子
51
9.11
C9
其他
11
1.96
合计
560
100.00
这是一个品质标志分组的分布数列。
从该数列中可以知道上市公司的行业结构。
1999年560个制造业上市公司中,27%是机械、仪表、设备制造业(包括汽车、船舶、摩托车、家电等);23%是石化类行业;而冶金、钢铁等金属非金属类公司占17%;通讯电子章9%。
所以,制造业上市公司中传统产业占了较大比重。
这些行业中大部分是国有或国有控股企业,是国企改革中率先建立现代企业制度进入资本市场的排头兵。
行业的分布也体现了国家的产业政策导向,在1999年新发行的A股中,大盘股和高科技股明显增多,有力地支持了国企改革和高科技企业的发展,推动了上市公司的行业结构优化。
方案设计
一、案例设计的思路
本案例研究的总体对象是某一特定时间的静态数据集,为了对它有一个全面和透彻的认识,一般应对其进行基本的特征描述和揭示各特征间主要的相互关系。
根据这一目的,本案例按照如下顺序对数据进行处理:
1.分别对总体个单位的数量标志按值的大小作升序排列,以大概认识个变量的变化范围及其一般水平。
2.分别计算总体个变量的特征值,进一步抽象认识个变量的分布特征,包括算术平均数、众数、方差、峰度度、偏度等。
3.分别根据特征指标绘制各变量的分布图,以形成对各变量分布的直观认识。
4.分别按品质标志和数量标志对总体进行分类,通过计算派生指标,以深入认识总体各指标在不同类别间的差异,包括总体结构、强度,比例关系等。
5.分别对总体各指标进行相关分析,了解各指标间的依存关系,在相关关系成立的基础上进行回归分析,从而更深层次地认识总体的规律与特征。
6.在上述研究分析的基础上给出关于对对象的定性认识结论。
二、案例设计的工作过程
(一)数据整理与描述
1.编制按各财务指标的变量数列
(1)将数据顺序排列。
(2)计算描述统计指标。
在Excel“工具”的“数据分析”中,“描述统计”提供了所分析数据的主要描述指标和有关信息。
其内容是;
平均——算术平均数,即=
标准误差——抽样平均误差,即
中值——中位数,即Me;
模式——众数,即Mo;
标准偏差——标准差,即;
样本方差——方差,即
峰值——峰度,即
偏斜度——偏度,即;
区域——全距,即最大值减最小值;
求和——标志总量;
计数——总体单位总数;
最大(K)——第K个最大值;
最小(K)——第K个最小值;
置信度——“数据分析”中默认概率为95%(也可自行选择)的1/2误差范围。
(3)分析描述统计指标——比较平均数、众数、中位数的大小;偏度系数的大小、方向等。
(4)确定组数和组距——当偏度系数不大时,用斯特吉斯经验公式确定组数;偏度系数较大、分布明显偏态时,以平均数为中心,以K倍标准差为组距。
(5)整理成频数分布和直方图(或其他图形),显示总体分布特征。
2.制造业公司主要财务指标的分布
(1)总资产分布数列和直方图
总资产描述统计1
平均
标准误差
中值
模式
标准差;
样本方差
峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度
(95%)
158315.1
8970.946
95296.9
212291.3
4.51E+10
30.19077
4.705128
2178598
12256.69
2190846
88656452
560
17620.89
总资产描述统计2
平均
标准差
中值
模式
标准差;
样本差
峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度
(95%)
144640.7
6388.948
95410.48
149424.9
2.23E=10
9.916375
2.885238
955269.6
21671.49
976941.1
79118478
547
12549.92
从描述统计1看,560家公司的总资产呈高度偏态。
总资产最大值是上海石化219亿元,最小值是ST黔凯涤1.2亿元,相差近200倍。
将6个总资产100亿和7个2亿元以下的数据作为极值舍去,计算得到描述统计2,此时的标准差和偏度系数都降低了,说明数据间的差异小了。
但仍呈偏态,不能用斯特吉斯经验确定组数。
不论何种分布,均值和方差其分布的两个主要特征值。
根据切比雪夫定理,可以平均数为中心,以K倍的标准差为组距,因为此时平均数K倍的标准差所涵盖的数据范围不小于1-1/。
本例中,均值14.5亿元,中位数9.5亿元,标准差15亿元,说明560家公司的总资产分布为右偏态。
若以1个标准差为组距,则中位数以下部分的描述势必过于概括。
所以考虑用1/2标准差,即7.5亿元为组距,由于100亿元以上只有7家,将105亿元以上并为一组,组数=15。
分组后变量数列及直方图如表二和图一所示。
表2—2560家上市公司总资产分组统计
分组(万元)
频数
频率(%)
75000以下
75000~150000
150000~225000
225000~300000
300000~375000
375000~450000
450000~525000
525000~600000
600000~675000
675000~750000
750000~825000
825000~900000
900000~975000
975000~1050000
1050000以上
209
192
64
33
18
15
4
2
4
6
2
1
3
1
6
37.32
34.29
11.43
5.89
3.21
2.68
0.71
0.36
0.71
1.07
0.36
0.18
0.54
0.18
1.07
合计
560
100.00
从图表中可以知道,制造业中,总资产8866亿元,平均规模在15亿元左右。
82%的上市公司总姿产在22.5亿元以下,100亿元以上的只有1%。
在各行业中,总资产规模最大的是C8——通信电子行业20.3亿元,最低的是C2——木材家具业6.38亿元,另外,C4——石油化工、C5——橡胶塑料、C6——金属非金属的总资产规模在平均之上。
图2—1560家制造业公司总资产分布
(2)净利润分布数列和直方图
净利润描述统计
平均
标准误差
中值
模式
标准偏差;
样本方差
峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度
(95%)
6669.48
516.2828
4120.164
#N/A
12217.48
1.49E+08
11.33344
2.485572
112886.5
-37417.9
75468.6
3734913
560
1014.092
净利润分布呈右偏态。
以1/2标准差6500万元为组距,可分17组。
分组后3.25亿元以上各组不仅频数少,而且有两组频数为0。
这种情况下可考虑合并这些组,因为合并后的数列并未影响总体特征的描述。
见表2—3和图2—2。
表2—3560家上市公司净利润分布
净利润分组(万元)
频数(个)
频率(%)
-13000以下
-13000~-6500
-6500~0
0~6500
6500~13000
13000~19500
19500~26000
26000~32500
32500以上
14
10
22
332
112
24
13
16
17
2.50
79
3.93
59.29
20.00
4.29
2.32
2.86
3.04
合计
560
100.00
净利润分组(万元)
图2—2560家上市公司净利润分布
将亏损1.3亿元以下的公司合并为一组,3.25亿元以上的公司合并为一组,组数减少到9组,总体仍为右偏态。
从整理后的净利润的资料我们注意到:
第一,制造业中,1999年度46家公司亏损,亏损面8.2%,最多的亏损3.7亿元。
第二,制造业1999年度净利润总额373.9亿元,受亏损公司的影响,560家公司总体平均利润只有6500万元。
79%的上市公司净利润在70万~1.3亿元之间。
第三,上海汽车、邯郸钢铁、上海石化、仪征化纤、首钢股份等大型国企全年利润均在7亿元以上;年净利润在4.5亿元以上的公司有16个,不足总数的3%,但它们的净利润占到制造业全行业的25.5%,充分体现了大型国企确实是国民经济的脊梁。
第四,进一步研究各行业的利润水平,可以看到有三个行业高与总体水平;C0——食品饮料净利闰0.79亿元;C6——金属非金属净利闰0.85亿元;C8——通信电子净利闰1亿元。
(3)每股收益分布数列和直方图
每股收益描述统计1
平均
标准误差
中值
模式
标准偏差;
样本方差
峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度
(95%)
0.199427
0.011551
0.2225
0.21
0.273352
0.074721
6.75641
-1.51182
2.632
-1.28
1.352
111.6792
560
0.022689
每股收益描述统计2
平均
标准误差
中值
模式
标准偏差;
样本方差
峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度
(95%)
0.204943
0.010571
0.223
0.21
0.249255
0.062128
4.912174
-1.27499
1.8891
-0.98
0.9091
113.9482
556
0.020764
每股收益是一强度相对指标。
从描述统计指标看,舍弃一个最大值后,均值、中位数、众数比较接近,偏度系数也不很大。
尝试按经验公式确定组数:
组数=1+3.322×㏒560=10;
组距=2/10=0.2,极值用开口组处理。
见表2—4和图2—3。
表2—4560家上市公司每股收益分组统计
分组
频数(个)
频率(%)
—0.6以下
-0.6~-0.4
-0.4~—0.2
-0.2~0
0~0.2
0.2~0.4
0.4~0.6
0.6~0.8
0.8~1.0
1.0以上
14
6
13
13
197
231
60
19
6
1
2.50
1.07
2.32
2.32
35.18
41.25
10.71
3.39
1.07
0.18
合计
560
100.00
每股收益分组(元)
图2—3560家上市公司每股收益分布
每股收益是按总股本平均的净利润,它排除了股本规模大小对净利润水平高低影响,反映了上市公司经营业绩水平。
不仅在行业之间,而且可以在公司之间进行比较。
从表2—4图2—3看560家公司每股收益的特点:
第一,1999年制造业的每股收益的分布略乘左偏态,即平均数为0.2元,但是相对多数的公司每股收益高于0.2元。
第二,35%的公司在0.01~0.2元的微利水平,52%的公司盈利水平再0.2~0.6元之间。
26家公司盈利水平较高,在0.6元以上,但只占4.5%。
1999年的改制表状元是五粮液,达到每股收益1.35元。
第三,分行也看,经营业绩差别的行业因素非常明显:
最高的是C0——食品饮料,达到每股收益0.31元;大于等于每股收益0.2元的还有C1—纺织、服装,C5——橡胶塑料,C8——同新点子,C9——其他;最低的事C2——木材家具,只有0.08元。
(4)净资产收益率分布数列和直方图
净资产收益率1
平均
标准误差
中值
模式
标准偏差;
样本方差
峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度
(95%)
2.971477
1.993256
9.04
6.21
47.08475
2216.974
117.5889
-10.1028
736.156
-639.53
96.626
1658.08
558
3.915216
净资产收益率2
平均
标准误差
中值
模式
标准偏差;
样本方差
峰值
偏斜度
区域
最小值
最大值
求和
计数
置信度
(95%)
8.006386
0.352228
9.14
6.21
8.185041
66.9949
6.881908
-1.63102
69.26
-34.92
34.34
4323.448
540
0.691909
由于资料中两个公司(0515PT渝钛白和600818ST永久)的净利润净资产为负值,所以此处只有58个公司的数据。
558个公司的净资产旅呈高度左偏态。
净资产收益率过高或过低,都数不正常情况。
舍弃40%以上和-40%以下的18个极端值后,描述指标基本正常。
以1倍标准差8%为组距、48%以上和-48%一下合并各1组,共分14组。
表2——5和图2——4显示,集中趋势非常明显。
表2——5560家公司净资产收益率分组统计
分组(%)
频数
频率(%)
小于-48
-48~-40
-40~-32
-32~-24
-24~-16
-16~-8
-8~0
0~8
8~16
16~24
24~32
32~40
40~48
大于48
13
1
2
5
6
8
10
190
270
39
7
3
1
3
2.33
0.18
0.36
0.90
4.08
1.43
1.79
34.05
48.39
6.99
1.25
0.54
0.18
0.54
合计
558
100.00
净资产收益率分组(%)
图2—4560家上市公司净资产收益率分布
净资产收益率是评价净资产盈利能力的综合指标,他代表了总体的或行业的盈利水平。
从统计资料看到:
第一,1999年度,制造业的总体净资产收益率9%(这里采用了中位数,因为忽略极值厚中位数没有变化,但平均数却差了几倍,而净资产收益率极端值时有个别特殊原因所致)。
第二,8%的公司亏损,与每股收益分析的结论一致;并且有两个公司净资产为负数,以资不抵债。
第三,34%的公司净资产收益率在0.1%~8%之间;48%的公司在0.8%~16%之间。
第四,8%的公司净资产在16%~32%的高水平上,从行业看,这些公司集中在生物制药、通信电子、汽车等高新技术产业,显示出发展最快、盈利水平最强的势头。
3.制造业各行业主要财务指标的分布
接下来利用符合分组表统计表的形式,总体分组的划分,展示制造业内部各行业的净利润、每股收益、净资产收益率的分布特征。
(1)制造业各行业净利润分布频数统计表和频率统计表
合计栏显示的是总体的净利润分布频数或频率,其他各栏显示的是个行业的分布(见表2—6、表2—5)。
表2—6制造业各行业净利润分布统计(频数)
代
码
净利润分组(万元)
行业分类
小于
-1.3
-1.3
~
-0.65
-0.65
~0
0~
0.65
0.65
~
1.3
1.3
~
1.95
1.95
~
2.6
2.6
~
3.25
大于
3.25
合计
C0
食品、饮料
1
27
14
3
1
1
1
48
C1
纺织、服装、皮毛
1
1
2
27
13
1
45
C2
木材、家具
1
1
2
C3
造纸、印刷
1
12
3
16
C4
石油、化工
2
2
5
81
28
6
2
4
130
C5
橡胶、塑料
8
1
1
10
C6
金属、非金属
3
4
2
53
17
4
3
5
5
96
C7
机械、仪表、设备
6
10
94
24
4
5
4
4
151
C8
通信、电子
2
2
1
22
10
3
4
4
3
51
C9
其他
7
2
2
11
合计
14
10
22
332
112
24
13
16
17
560
从表2—6、2—7中可以看到:
第一,总共45个亏损公司,占全部公司的8%,他们的行业间分布是:
C7——机械、仪表、设备行业亏损面最大,有16家,占行业10.7%;其次是C8、C6和C1——分别为9.8%、9.4%、8.8%;C2——木材家具仅有2家公司,亏损1家。
第二,C5——橡胶、塑料和C9——其他行业无亏损企业,且净利润水均衡,集中在0~19500万元。
第三,净利润绝对水平的高低与行业类别有关联,3亿元以上净利润集中在酿酒、石化、冶金、电子通信设备等行业;利润水平较低的有纺织、木材家具及印刷、造纸行业。
表2—7制造业各行业净利润分布统计(频率%)
代
码
净利润分组(万元)
行业分类
小于
-1.3
-1.3
~
-0.65
-0.65
~0
0~
0.65
0.65
~
1.3
1.3
~
1.95
1.95
~
2.6
2.6
~
3.25
大于
3.25
合计
C0
食品、饮料
2.1
56.3
29.2
6.3
2.1