上海交易所证券股市走势分析Word格式文档下载.docx
《上海交易所证券股市走势分析Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《上海交易所证券股市走势分析Word格式文档下载.docx(26页珍藏版)》请在冰点文库上搜索。
2003
1468.01
-6.00%
1995
643.78
-0.45%
2004
1467.06
-0.06%
1996
767.53
19.22%
2005
1144.54
-21.98%
1997
1182.596
54.08%
2006
1687.14
47.41%
1998
1257.25
6.31%
2007
3062.59
81.53%
1999
1381.49
然后我们对其图像进行拟合,在进行线形拟合,指数拟合,对数拟合,多项式拟合等多种拟合方法后,通过比较我们发现5次多项式的拟合程度是比较高的,如下图所示(蓝色的线表示的是实际收盘指数平均值,黄色的虚线是拟合图像)
图1
我们对五次多项式进行系数估计。
首先将横坐标1990-1991点取为原点:
经过Excel计算我们得到多项式为:
y=-0.0038x6+0.3846x5-11.788x4+155.28x3-937.61x2+2501.7x-1548.1①
其中R2=0.9689
由此我们便可以预测2007年上证指数平均值为2710.84,从表中我们可以看到在2007年前4个月的平均收盘指数为3062.59,所以可以预知在后面的八个月中上证收盘指数将会下跌至平均线以下。
(二)我们对①式进行求导可得:
y’=-0.0228x5+1.923x4-47.152x3+465.84x2-1875.22x+2501.7
令y’=0我们便可以求出5个极值点,这也可以从图上的拟合曲线看出。
从实际来看,上海股市的综合指数的确随着我国改革开放和社会主义现代化建设的进程中稳步上涨。
这种估计与实际也是比较相符的。
(三)统计学中的方差、标准差是用来描述离散点与期望之间的紧密程度。
是离散点与期望距离的期望。
我们求出了17年来上证收盘指数每年的标准差,如下表所示:
收盘指数标准差
55.87
151.57
307.92
195.47
180.78
105.93
134.15
65.66
65.53
149.07
163.5
64.65
108.35
379.6
76.89
243.48
表中的标准差数值越大,则表明在该一年股市的暴涨暴跌的情况比较严重。
但标准差对当时政策和经济的依赖较大。
政策的改变与经济的波动都会影响到标准差的取值。
例如在1992年和2006年(两个标准差较大的年份)就发生了一些对经济影响较深的重要事件。
二、上证综合收盘指数与开盘指数、最低指数和最高指数的关系。
(一)我们对表中所给数据进行折线作图,所的图像如下:
由以上四个图可以看出,收盘指数、开盘指数、最高指数、最低指数随时间变化的折线图十分的相似,因此我们采取线性拟合的办法,试将收盘指数用开盘指数,最高指数,最低指数线性表示。
参数设置:
收盘指数:
s
开盘指数:
x1开盘指数线性系数:
k1
最高指数:
x2最高指数线性系数:
k2
最低指数:
x3最低指数线性系数:
k3
(二)公式推导:
由于是考虑收盘指数是由开盘指数、最高指数、最低指数线性表示而成,所以可得基本关系式:
S=k1*x1+k2*x2+k3*x3②
我们将17年以来收盘指数、开盘指数等可以分别看作一个1行,197列的矩阵。
以收盘指数为例:
S=(126.45130.44133.47120.19113.94114.83137.56……………)1*197
K1,k2,k3依然作为系数,而不是矩阵。
X1,X2,X3是与S等规格的矩阵,分别为开盘指数,最高指数,最低指数。
则②也成立,然后我们就将其可以转化成为一个求最优解的问题,存在约束条件:
0<
=ki<
=1。
使用lingo软件寻求最优解。
下面考虑目标函数,因为我们所做的是线性拟合,所以我们寻求的是②中等式右边所算出的值S’与实际值S的偏差越小越好,这也类似于方差的原理。
即为矩阵ΔS:
ΔS=S-S’=S-(k1*x1+k2*x2+k3*x3)
ΔS矩阵中所有元素的平方和的最小值和此时k1,k2,k3的值。
通过计算可得:
ΔS矩阵中所有元素的平方和取最小值时k1=0,k2=0.7816,k3=0.2095
所以S=0.7816*x2+0.2095*x3。
即:
收盘指数=0.7816*最高指数+0.2095*最低指数
三、收盘指数与成交量,成交总额的关系
收盘指数、开盘指数、最高指数、最低指数、成交量股价图
将此股价图的x轴标度细化后可以发现成交量与收盘指数存在这样的关系:
1、当交易量的数值比较小时,交易量与收盘指数不存在任何的线性或者其他关系。
2、当交易量的数值比较大时,收盘指数与交易量存在线性关系。
四、上证综合收盘指数的季节因素分析
(一)上证收盘指数的标准化
从1990年到2007年17年的时间里,股市的各项指数变化很大,要观察收盘指数季节性,就要考虑在每一年收盘指数的变化,同时也要建立一个统一的标准,使得每一年之间也具有可比性,于是运用统计学原理我们对数据以年为单位进行数据标准化
数据标准化公式:
:
为标准化后的数值。
D:
为方差
此年的平均值
原始数值
(二)数据标准化后进行以时间为横轴,标准化数据为纵轴的图像如下图所示:
(三)以零线作为标准,统计各月份处于平均线之上的概率,列表如下:
月份
零线之上
所占比率
Jan
6
0.352941176
July
8
0.5
Feb
5
0.294117647
Aug
9
0.5625
May
0.529411765
Sep
Apr
Oct
0.375
Mar
7
0.4375
Nov
June
10
0.625
Dec
0.470588235
北半球的春季是从2月开始,所以根据公式
计算各季度期望可以得:
第一季度(2月-4月):
45.67%
第二季度(5月-7月):
52.08%
第三季度(8月-10月):
50%
第四季度(11月-转年1月):
42.03%
由此我们可以看到,上证收盘指数在一、四季度的状况不及二、三季度股市状况。
(四)统计每月涨跌情况所占比率,右上图我们可以得到以下数据:
上涨
11
0.647058824
0.3125
13
0.764705882
12
0.705882353
0.75
使用同样求平均值公式可得:
70.6%
43.7%
47.5%
58.8%
我们可以看到,每月涨跌情况与各月处在平均线之上的情况恰好相反,这里是不矛盾的。
我们由此也可以得到上证收盘指数每年走势的规律:
在每年的年初开始处于上涨阶段(注:
尽管一月份处于平均线以下,但这是由所选区域是年区域导致的,由于所有图和数据都是标准化后的数据,所以一月标准值低并不一定意味着比上一年十二月份的指数低,因为所取标准不同),到六七月份会出现涨停,然后开始下跌。
有部分年情况与此恰好相反,但是对于每一年而言,都有一个涨与跌的轮换,而不是围着平均线上下浮动。
对于模型的进一步思考:
一、对于三个问题之间联系的观察:
在第一题的运算中我们得到了这样的一个结论:
“由此我们便可以预测2007年上证指数平均值为2710.84,从表中我们可以看到在2007年前4个月的平均收盘指数为3062.59,所以可以预知在后面的八个月中上证收盘指数将会下跌至平均线以下。
”(上文引用),其现象我们从第三题也可以得到印证。
“对于每一年而言,都有一个涨与跌的轮换,而不是围着平均线上下浮动。
”,通过观察和统计我们就可以估计到下跌可能性最大的月份5-7月份。
虽然现在看到的只是表面数据,但是其中必然有这一层很深刻的联系。
其中会蕴含着经济学等原理。
二、第三个问题中划分区域所带来的问题
在第三题中,我们以一年为单位划分区域,并利用统计学的知识进行标准化。
但是标准化就会带来一个问题,那就是相邻区域的数据衔接问题。
按照此模型的划分,相邻两年的标准化数值是没有任何可比性的。
因为在标准化的过程中所需要的期望与方差是不一样的,也就导致了零线的不同实际取值。
以97年12月和98年1月为例,两个月份的标准值分别为0.106和-0.447,但是收盘指数却为1194.10和1222.91。
所以在遇到区域边界时单纯的比较标准化后的值是没有意义的,应该比较实际值。
三、收盘指数年平均值的n阶多项式拟合:
我们在第一题的求解中用到了数据的曲线拟合,由于直线拟合,指数拟合逻辑曲线拟合等所模拟的时间序列变化趋势比较单调,对于像股票这样的时间序列,由于其上涨下跌变化不定,因此用多项式的拟合更加合适,一般来讲,多项式模型的阶次越高,你和得精度越好,但实际中模拟的阶数部可能太高,我们采用的是6阶多项式的拟合。
在试验和计算中我们发现,使用5阶多项式拟合也是可行的。
于是我们又进一步的对多项式拟合进行深入的试验:
(1)3阶拟合:
(2)4阶拟合
(3)5阶拟合
对于拟合精度的好坏,我们只须观察R2的值,我们可以看到3、4、5、6阶拟合后的R2值分别为0.6703、0.7798、0.9676、0.9689,所以6阶拟合是比较合适的,也成为了我们最终的选择(最开始选择的是5阶拟合)。
同时选取6阶拟合的另一个原因是使用5阶拟合时,求导后会有4个极值点,实际图中已经出现四个极值点,这也就意味着2007年后上证收盘指数将会一直上涨,不出现回落状态,这是不符合实际的,所以采取6阶是很合理的。
附件1:
建模题目所给资料数据
日期
交易量
开盘指数
最高指数
最低指数
收盘指数
交易金额(万元)
1990-12-28
108
126.39
126.45
125.28
1991-1-30
36,565
127.61
134.74
130.44
1,964.00
1991-2-27
33,453
129.5
134.87
128.53
133.47
2,044.00
1991-3-29
23,295
132.53
120.11
120.19
1,560.00
1991-4-30
70,671
120.69
122.2
113.89
113.94
3,649.00
1991-5-31
76,786
113.04
114.83
104.96
3,946.00
1991-6-28
77,828
115.9
137.56
114.89
4,641.00
1991-7-31
160,132
136.64
143.8
131.87
8,594.00
1991-8-30
80,814
145.12
178.43
4,428.00
1991-9-30
286,133
180.08
191.18
180.92
19,413.00
1991-10-31
223,443
181.55
218.6
179.8
14,951.00
1991-11-29
96,270
220.71
259.85
259.6
8,019.00
1991-12-31
43,666
261.78
292.75
259.67
4,665.00
1992-1-31
16,905
293.74
313.24
292.76
2,268.00
1992-2-28
108,287
314.18
364.67
364.66
16,570.00
1992-3-31
161,441
365.15
382.06
381.24
34,680.00
1992-4-30
510,611
381.55
448.94
381.01
445.38
80,496.00
1992-5-29
1,073,313
454.86
1,429.01
439.96
1,234.71
208,523.00
1992-6-30
794,087
1,175.69
1,249.58
1,033.47
1,191.19
200,664.00
1992-7-31
1,388,425
1,199.54
1,215.24
961.61
1,052.07
278,120.00
1992-8-31
2,040,679
1,034.70
1,060.36
627.36
823.27
286,258.00
1992-9-30
2,089,985
826.96
832.84
595.42
702.32
273,412.00
1992-10-30
2,046,371
676.47
713.77
447.93
507.25
228,482.00
1992-11-30
3,251,862
471.18
752.32
386.85
724.6
282,849.00
1992-12-31
4,761,674
718.99
841.02
592.78
780.39
621,652.00
1993-1-29
7,341,654
784.13
1,198.48
777.16
1,152,714.00
1993-2-26
12,275,779
1,242.35
1,558.95
1,196.47
1,339.88
2,599,714.00
1993-3-31
7,621,896
1,328.22
1,339.10
913.74
925.91
1,460,900.00
1993-4-30
12,998,694
921.59
1,392.62
915.59
1,358.78
2,609,816.00
1993-5-31
6,612,356
1,365.15
1,380.50
930.64
935.48
1,212,499.00
1993-6-30
9,065,218
935.9
1,177.91
859.48
1,007.05
1,547,514.00
1993-7-30
6,560,435
1,000.80
1,009.89
777.73
881.07
807,471.00
1993-8-31
14,976,937
885.31
1,042.47
823
895.68
1,815,312.00
1993-9-30
6,194,908
898.01
947.53
864.38
890.27
692,399.00
1993-10-29
15,145,361
895.69
934.4
774.54
814.82
2,364,161.00
1993-11-30
26,927,669
801.86
1,011.76
793.32
984.93
3,731,798.00
1993-12-31
27,155,402
993.67
1,044.85
750.46
833.8
3,679,547.00
1994-1-31
24,245,439
837.7
907.09
760.78
770.25
2,359,665.00
1994-2-28
15,068,988
818.57
749.63
770.98
1,548,399.00
1994-3-31
53,540,892
771.52
807.52
694.03
704.46
5,807,720.00
1994-4-29
39,314,387
704.93
705.41
536.34
592.56
3,177,417.00
1994-5-31
41,944,620
593.94
620.94
537.78
556.26
2,319,451.00
1994-6-30
21,192,207
554.08
556.9
458.74
469.29
1,051,916.00
1994-7-29
15,428,914
469.27
469.43
325.89
333.92
763,791.00
1994-8-31
207,322,046
394.87
787.22
377.97
785.33
14,849,852.00
1994-9-30
148,753,124
785.61
1,052.94
785.56
791.15
15,156,706.00
1994-10-31
65,577,130
770.9
794.85
546.79
654.98
5,588,234.00
1994-11-30
32,386,736
667.66
743.22
648.68
683.59
2,948,145.00
1994-12-30
21,634,041
684.02
695.22
620.47
647.87
2,017,596.00
1995-1-27
7,730,020
637.72
657.45
547.38
562.59
502,634.00
1995-2-28
10,386,637
559.78
608.58
524.43
549.26
630,895.00
1995-3-31
29,372,607
548.91
648.04
545.72
646.92
2,336,011.00
1995-4-28
28,363,360
651.04
681.15
547.21
579.93
2,028,905.00
1995-5-31
61,336,107
576.69
926.41
564.86
700.51
5,265,625.00
1995-6-30
25,958,245
703.72
722.3
625.7
630.58
1,527,065.00
1995-7-31
67,028,126
623.14
723.68
610.33
695.55
3,192,636.00
1995-8-31
101,941,431
697.22
788.16
688.65
723.87
5,321,650.00
1995-9-29
59,630,004
726.04
792.54
699.1
722.43
3,158,610.00
1995-10-31