金融数据处理方案.docx
《金融数据处理方案.docx》由会员分享,可在线阅读,更多相关《金融数据处理方案.docx(26页珍藏版)》请在冰点文库上搜索。
金融数据处理方案
金融数据处理方案设计
基于Eviews
班级:
学号:
姓名:
成绩:
优良中及不
2018年1月11日
实训目的及内容
实训目的
根据所掌握的计量经济学等相关知识,利用相关计量软件,分析金融数据,验证金融基本理论或模型。
实训内容
金融学理论范畴非常广泛,包括的知识体系非常大。
鉴于金融资产投资人最关注的是其收益和风险,我们可以从以下项目选做:
(1)收益率分析及其波动性;
(2)投资组合理论与资本资产定价模型;(3)固定收益证券分析;(4)基于VaR的金融风险分析于度量;(5)衍生产品分析预定价等等。
实训项目
项目名称
简介
1、计量经济学软件介绍
主要介绍Eviews的概念、特点、优点、处理的数据对象、主要功能、主要菜单项等。
2、股票收益率基础分析
通过通达信网站收集了2016年4月19日—2018年01月3日万科A、泸州老窖、四川九洲三只股票及沪深300综合指数的历史交易数据即收盘价,使用Excel软件计算出其对数收益率,然后利用Eviews软件做出收益率时间序列图,分析收益率波动性,然后进行正态性检验,自相关检验,异方差检验。
3、股票波动性分析及预测
通过ARCH-LMtest检验来检验上证指数的超额收益率的残差项是否具有集群性、波动性,即ARCH效应和GARCH效应。
4、资本资产定价模型分析
介绍CAPM模型的相关理论以及函数关系式;分别进行自相关检验、单位根检验、协整检验以及格兰杰因果检验;利用协整理论分析资产收益率与市场风险溢价之间的关系。
5、风险管理模型VaR分析
根据计算出的沪深300指数超额收益率的均值和方差,在给定概率为5%的水平下计算VaR。
项目一:
Eviews简介
Eviews是EconometricsViews的缩写,直译为计量经济学观察,通常称为计量经济学软件包。
它的本意是对与经济活动的数量规律,采用计量经济学方法与技术进行“观察”。
另外Eviews也是美国QMS公司研制的在Windows下专门从事数据分析、回归分析和预测的工具。
使用Eviews可以迅速地从数据中寻找出统计关系,并用得到的关系去预测数据的未来值。
Eviews的应用范围包括:
科学实验数据分析与评估、金融分析、宏观经济预测、仿真、销售预测和成本分析等。
Eviews处理的基本是时间序列,每个序列有一个名称,只要提及序列的名称就可以对序列中所有的观察值进行操作,Eviews允许用户以简便的可视化的方式从键盘或磁盘文件中输入数据,根据已有的序列生成新的序列,在屏幕上显示序列或打印机上打印输出序列,对序列之间存在的关系进行统计分析。
Eviews具有操作简便且可视化的操作风格,体现在从键盘或从键盘输入数据序列、依据已有序列生成新序列、显示和打印序列以及对序列之间存在的关系进行统计分析等方面。
Eviews具有现代Windows软件可视化操作的优良性。
可以使用鼠标对标准的Windows菜单和对话框进行操作。
操作结果出现在窗口中并能采用标准的Windows技术对操作结果进行处理。
此外,Eviews还拥有强大的命令功能和语言功能。
在Eviews的命令行中输入、编辑和执行命令。
在中建立和存储命令,以便在后续的研究项目中使用这些程序。
Eviews主要功能:
1、引入了流行的对象概念,操作灵活简便,可采用多种操作方式进行各种计量分析和统计分析,数据管理简单方便。
其主要功能有:
2、采用统一的方式管理数据,通过对象、视图和过程实现对数据的各种操作;
3、输入、扩展和修改或截面数据,依据已有序列按任意复杂的公式生成新的序列;
4、计算描述统计量:
相关系数、协方差、自相关系数、互相关系数和直方图;
5、进行T检验、方差分析、协整检验、Granger因果检验;
6、执行普通最小二乘法、带有自回归校正的最小二乘法、两阶段最小二乘法和三阶段最小二乘法、、广义矩估计法、ARCH模型估计法等。
Eviews应用领域:
1、应用经济计量学2、总体经济的研究和预测3、销售预测4、财务分析5、成本分析和预测6、模拟7、经济模型的估计和仿真8、利率与外汇预测。
Eviews窗口简介:
Eviews的窗口上方按照功能划分9个主菜单选项,鼠标左键单击任意选项会出现不同的下拉菜单,显示该部分的具体功能,9个主菜单选项提供的主要功能如下。
File有关文件(工作文件、数据库、Eviews程序等)的常规操作,如文件的建立(New)、打开(Open)、保存(Save/SaveAs)、关闭(Close)、读入(Import)、读出(Export)、打印(Print)、打印设置(PrintSetup)、程序运行(Run)、退出(Exit)等,选择Exit将退出Eviews软件。
Edit相关下拉菜单有撤消(Undo)、剪切(Cut)、复制(Copy)、粘贴(Paste)、删除(Delete)、查找(Find)、替换(Replace)、合并(Merge)等功能,但通常情况下只提供复制功能,选择Undo则撤消上步操作。
Object提供关于对象的基本操作。
包括建立新对象(NewObject)、从数据库获取(FetchfromDB)、更新对象(UpdatefromDB)、将工作文件中的对象存储到数据库(StoretoDB)、复制对象(CopyObject)、命名(Name)、删除对象(Delete)、打印(Print)、视图选择(ViewOption)等。
View和Proc这两个主菜单的下拉菜单功能项随当前窗口不同而不同,主要涉及变量的多种查看方式和运算过程。
Quick主要提供快速分析过程,包括常用的统计过程如抽样(Sample)、产生序列(GenerateSeries)、统计图(Graph)等,描述统计如序列统计量(SeriesStatistics)、群统计量(GroupStatistics)等以及方程估计(EstimateEquation)、估计向量自回归模型(EstimateVAR)等。
Options系统参数设定选项。
软件运行过程中的各种状态,如窗口的显示模式、字体、视图、表格等都有默认的格式,用户可以根据需要进行选择和修改。
Window提供多种在打开窗口中进行切换的方式,以及关闭所有窗口(CloseAll)和关闭所有对象(CloseAllObjects)等。
Help帮助选项。
主窗口的主菜单下空白区域时交互模式下的命令输入区,每次允许键入一个操作命令。
主窗口中大面积的空区域是留给其他子窗口显示所用。
最下面是状态显示行,有程序路径、数据库和工作文件名称等相关内容。
项目二:
股票收益率基础分析
一、相关理论分析
(一)简单收益率
股票收益率指投资于股票所获得的收益总额与原始投资额的比率。
股票得到投资者的青睐,是因为购买股票所带来的收益。
股票的绝对收益率就是股息,相对收益就是股票收益率。
股票收益率的计算公式:
股票收益率=收益额/原始投资额,运用金融学知识,计算股票收益率其中,简单收益率公式=(卖出价-买入价)/买入价
(二)对数收益率
对数收益率同连续复利收益率R′=ln(1+R)
(1)
(三)股利收益率
股利收益率,又称获利率,是指股份公司以现金形式派发的股息或红利与股票市场价格的比率其计算公式为:
股利收益率=(/每股原市价)×100%,该收益率可用计算已得的股利收益率,也能用于预测未来可能的股利收益率。
(四)持有期收益率
持有期收益率指投资者持有股票期间的股息收入和买卖差价之和与股票买入价的比率。
其计算公式为:
[现金股息+(股票卖出价-股票买入价)]/股票买入价×100%,股票还没有到期日的,投资者持有股票时间短则几天、长则为数年,持有期收益率就是反映投资者在一定持有期中的全部股利收入以及资本利得占投资本金的比重。
持有期收益率为投资者最关心的指标,但如果要把它与债券收益率及银行利率等其他金融资产的收益率作比较,必须注意时间的可比性,即要把持有期收益率转化为年率。
二、指标及方法说明
(一)股票的选取
选取了万科A、泸州老窖、四川九洲三只股票和沪深300指数,从通达信金融终端中导出数据,利用开盘价和收盘价计算收益率。
股票代码
股票名称
000002
万科A
000568
泸州老窖
000801
四川九洲
399300
沪深300指数
(二)指标方法说明
1.选择简单收益率和对数收益率,简单收益率=(Pt-Pt-1)/Pt-1,对数收益率=ln(Pt)-ln(Pt-1);
2.计算简单收益率与对数收益率之间的差值;
3.描述性统计:
根据所得数据中的偏度和峰度以及尖峰后尾性进行分析;
4.时序图分析:
根据所得股票时序图分析其极具集聚现象;
5.统计分布特征:
画出分布直方图,并对其进行正态检验QQ分位图。
三、实验过程及分析
第一步:
对数收益率和百分比收益率之差
图1.1对数收益率和百分比收益率之差
由图1.1可以看出,四川九洲的对数收益率和百分比收益率之差最大,在-0.205至0.254范围内;沪深300指数的对数收益率和百分比收益率之差最小,在-0.013至0.013范围内;泸州老窖和万科A的对数收益率和百分比收益率之差相差不大。
可以看出四组数据都具有波动集聚性。
第二步:
作出时序图
图2.1万科A收益率时序图图2.2泸州老窖收益率时序图
图2.3四川九洲收益率时序图图2.4沪深300指数收益率时序图
时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。
平稳时间序列粗略地讲,一个时间序列,如果均值没有系统的变化(无趋势)、方差没有系统变化,且严格消除了周期性变化,就称之是平稳的。
由以上四张图可以看出其各自的均值没有变化,且无周期性变化,因此可知万科A、泸州老窖、四川九洲、沪深300指数的收益率都是比较平稳的。
第三步:
作出分布直方图
图3.1万科A收益率分布直方图图3.2泸州老窖收益率分布直方图
图3.3四川九洲收益率分布直方图图3.4沪深300收益率分布直方图
由图3.1可以看出万科A的收益率均值为0.002267,偏度为0.95491,重尾在右侧,分布右偏,峰度为6.387733,比正态分布的高峰更加陡峭,为尖顶峰;由图3.2可以看出泸州老窖的收益率均值为0.002451,偏度为0.086984,重尾在右侧,分布右偏,峰度为3.959637,比正态分布的高峰更加陡峭,为尖顶峰;由图3.3可以看出四川九洲的收益率均值为-0.003491,偏度为0.095657,重尾在右侧,分布右偏,峰度为210.1168,比正态分布的高峰更加陡峭,为尖顶峰;由图3.4可以看出沪深300指数的收益率均值为0.000582,偏度为-0.031349,重尾在左侧,分布左偏,峰度为6.161366,比正态分布的高峰更加陡峭,为尖顶峰。
四组数据都不服从正态分布,而是体现出尖峰厚尾性,即峰度大于3,两边的尾巴比正态分布长。
第四步:
作出QQ分位图
图4.1万科AQQ分位图图4.2泸州老窖QQ分位图
图4.3四川九洲QQ分位图图4.4沪深300指数QQ分位图
由四张图可以看出,这四组数据都服从对称钟形分布,其特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少。
每张图的两端都存在幅度,即都存在峰度,且峰度都大于3。
比较四张图可以看出泸州老窖与直线最为接近,其峰度最小;沪深300指数的峰度最大。
而标准正态分布的偏度为0,峰度为3,因此四组数据都不服从标准正态分布。
结果分析:
本项目分析选取了万科A、泸州老窖、四川九洲三只股票和沪深300指数,时间为2016.4.19-2018.1.3。
从以上的实验数据可以看出这三只股票的走势和大盘指数基本相符合。
在所选取的时间段内,泸州老窖的分布最为稳定,说明其收益最好;由图3.3可以看出四川九洲的收益率均值为负值;由图1.1可以看出,万科A的对数收益率和百分比收益率之差最大,即它的资产收益在三个企业中浮动较大;由图1.1可以看出沪深300指数的对数收益率和百分比收益率之差最小,由图2.4可以看出2016年年中的幅度变动较大,但从整个上证指数的波动频率上看整体呈现平稳的状态。
项目三:
股票波动性分析及预测
一、相关理论分析
波动率是金融资产价格的波动程度,是对资产收益率不确定性的衡量,用于反映金融资产的风险水平。
波动率越高,金融资产价格的波动越剧烈,资产收益率的不确定性就越强;波动率越低,金融资产价格的波动越平缓,资产收益率的确定性就越强。
从经济意义上解释,产生波动率的主要原因来自以下三个方面:
1、宏观经济因素对某个产业部门的影响,即所谓的系统风险;
2、特定的事件对某个企业的冲击,即所谓的非系统风险;
3、投资者心理状态或预期的变化对股票价格所产生的作用。
二、指标及方法说明
(一)指标选择
选择泸州老窖股票及其沪深300指数,并计算其对数收益率。
股票代码
股票名称
000568
泸州老窖
399300
沪深300指数
(二)方法说明
在1982年,由罗伯特•恩格尔提出ARCH模型,也就是自回归条件异方差模型(AutoregressiveConditionalHeteroskedasticity),为了研究计量经济学中某些时间序列模型的波动性,而且发现此模型可以较好的分析时间序列的波动性,于是乎该模型被广泛使用,甚至被运用到金融理论方面,在1986年,Bollerslev提出了GARCH模型,也就是广义自回归条件异方差模型,此模型在ARCH模型的基础上做了拓展,能够对在ARCH模型中产生的误差进行下一步的建立模型,使得结果更加的完善,同时广义ARCH模型对于结果的预测更加准确,比ARCH模型分析波动性预测未来的结果更好,对于投资者来说,利用GARCH模型来预测,可以更好的做出投资的选择,在1991年,Nelson提出了EGARCH模型,此模型相比于GARCH模型,能够更好地判断好消息与坏消息对结果的影响。
ARCH模型为了不出现拟合问题,Bollerslev提出了GARCH模型的研究方法。
因此在某些情况下,GARCH(1,1)模型:
在估计模型的参数时,通常会采用这种形式,一旦
、
和
被估算,我们可以由
来计算
,长期方差
。
为了保证GARCH(1,1)模型的稳定,我们需要
,否则对应于长期方差的权重会是负值。
由GARCH(1,1)模型我们可以推广到一般的GARCH(p,q)模型,即
GARCH(p,q)模型被广泛应用于和的,相比于ARCH模型,GARCH模型更能反映实际数据中的长期记忆性质。
由于GARCH(p,q)模型是ARCH模型的扩展,因此GARCH(p,q)同样具有ARCH(q)模型的特点。
GARCH模型适合在计算量不大时,方便地描述了高阶的ARCH过程,因而具有更大的适用性。
三、实验过程及分析
第一步:
泸州老窖和沪深300指数收益率的统计性分析
基于项目二的实验分析,从图2.1和图2.4可以看出泸州老窖收益率的振荡幅度明显大于沪深300指数收益率的振荡幅度,且都呈现集聚性;由图3.1可以看出泸州老窖的收益率均值为0.001335,偏度为0.697571,重尾在右侧,分布右偏,峰度为5.954889,比正态分布的高峰更加陡峭,为尖顶峰。
由图3.4可以看出沪深300指数的收益率均值为0.000242,偏度为-0.440446,重尾在左侧,分布左偏,峰度为7.132638,比正态分布的高峰更加陡峭,为尖顶峰。
两组数据都不服从正态分布,而是体现出尖峰厚尾性。
基于项目四的实验分析,由图6.2可以看出自相关和偏自相关系数均落入两倍的估计标准差内,并且Q统计量对应的P值均大于置信度0.05,故该序列在5%的显著性水平上不存在显著的自相关。
;由图6.3可以看出泸州老窖的收益率t值为-19.72293,对应的P值与0无显著差别;由图6.4可以看出沪深300指数的收益率t值为-20.04969,对应的P值也与0无显著差别,即两组数据都不存在单位根,都是平稳的序列。
第二步:
检验是否存在garch效应
求出残差(收益率减去其均值)的平方,检测这个序列的相关性。
图5.1残差平方的自相关结果
由图5.1可以看出,Q-Stat对应的P值明显与0无差别,即小于置信度0.05,故该序列在5%的显著性水平上存在显著的自相关性,所以有ARCH效应。
第三步:
GARCH模型拟合
图5.2Garch(1,1)估计结果
图5.3Garch(1,2)估计结果
图5.4Garch(2,1)估计结果
由图5.2、5.3可知,当GARCH(p,q)模型中p=1,即残差项只取前一期(t-1期)时,波动率的滞后项取到t-2期时,模型的估计效果最好,此时在显著性水平α=0.05下,其所有的系数都通过了t检验,且其AIC值和SC值都比Garch(1,1)模型的小,因而效果最好;由图5.4可知,当GARCH(p,q)模型中q=1,即波动率的滞后项取前一期(t-1期),残差项只取前一期(t-1期),时,在显著性水平α=0.05下,其系数基本上未都通过t检验。
因此对沪深300指数收益率的波动性进行预测时,采用GARCH(2,1)效果最好。
结果分析:
本项目选取了泸州老窖及大盘沪深300指数,并分别计算出对数收益率,再分别用对数收益率减去其均值得出残差,然后分别取残差的平方;对大盘沪深300指数进行自相关序列检验,由图5.1可以看出该序列在5%的显著性水平上存在显著的自相关性,所以有ARCH效应;接着用garch(1,1),garch(1,2),garch(2,1)分别进行估计,结果显示garch(2,1)模型的估计效果最好,在显著性水平α=0.05下,其所有的系数都通过了t检验,且其AIC值和SC值都比Garch(1,1)模型的小,因而效果最好。
项目四:
资本资产定价模型分析
一、相关理论分析
(一)CAPM模型相关理论
资本资产定价模型(CAPM模型)假设所有投资者都按马克维茨的资产选择理论进行投资,对期望收益、方差和协方差等的估计完全相同,投资人可以自由借贷。
基于这样的假设,资本资产定价模型研究的重点在于探求风险资产收益与风险的数量关系,即为了补偿某一特定程度的风险,投资者应该获得多少的报酬率。
资本资产定价模型(CAPM模型)是建立在马科威茨模型基础上的,马科威茨模型的假设自然包含在其中,第一,投资者是理性的,而且严格按照马科威茨模型的规则进行多样化的投资,并将从有效边界的某处选择投资组合;第二,资本市场是完全有效的市场,没有任何磨擦阻碍投资。
(二)CAPM模型函数关系式
当资本市场达到均衡时,风险的边际价格是不变的,任何改变市场组合的投资所带来的边际效果是相同的,即增加一个单位的风险所得到的补偿是相同的。
按照β的定义,代入均衡的资本市场条件下,得到资本资产定价模型:
E(ri)=rf+βim[E(rm)-rf]
其中E(ri)是资产i的预期回报率;rf是无风险利率;βim是[[Beta系数]],即资产i的系统性风险;E(rm)是市场m的预期市场回报率;E(rm)-rf是市场风险溢价(marketriskpremium),即预期市场回报率与无风险回报率之差。
资本资产定价模型的说明如下:
1.单个证券的期望收益率由两个部分组成,无风险利率以及对所承担风险的补偿-风险溢价。
2.风险溢价的大小取决于β值的大小。
β值越高,表明单个证券的风险越高,所得到的补偿也就越高。
3.β度量的是单个证券的系统风险,非系统性风险没有风险补偿。
二、指标及方法说明
(一)指标选择
以一年期银行定期存款利率作为无风险利率,并换算成日利率;选择泸州老窖股票及其沪深300指数,并计算其对数收益率。
股票代码
股票名称
000568
泸州老窖
399300
沪深300指数
(二)计量方法说明
1.自相关检验
如果随机误差项的各期望值之间存在着相关关系,这时,称随机误差项之间存在自相关性(autocorrelation)或序列相关。
若序列自相关则不平稳,若序列不相关则平稳。
2.单位根检验
单位根检验是指检验序列中是否存在,因为存在单位根就是非平稳时间序列了。
单位根就是指单位根过程,可以证明,序列中存在单位根过程就不平稳,会使回归分析中存在。
3.协整检验
非平稳序列很可能出现伪回归,协整的意义就是检验它们的回归方程所描述的因果关系是否是伪回归,即检验变量之间是否存在稳定的关系。
所以,非平稳序列的因果关系检验就是协整检验。
4.格兰杰因果检验
格兰杰因果关系检验是一种的统计方法,检验一组x是否为另一组时间序列y的原因。
它的基础是当中的。
回归分析通常只能得出不同间的同期;自回归模型只能得出同一变量前后期的相关性。
三、实验过程及分析
第一步:
计算超额收益率和β值
1.将泸州老窖、上证指数的对数收益率计算出来,然后以一年期银行定期存款利率Rf=1.5%作为无风险收益率,折算成日收益率,最后分别计算超额收益率。
2.用一元线性回归估计β值
图6.1一元线性回归结果
从图6.1可以得出回归系数为1.259338,常数项系数为0.001729,得出一元回归方程Y=0.001729+1.259338X.回归方程说明一个单位市场组合(沪深300指数)的超额收益率的变化将引起1.259338单位的泸州老窖的超额收益率同方向的变化,即线性方程的系数β为1.259338。
第二步:
自相关检验
图6.2自相关检验结果
由图6.2可以看出自相关和偏自相关系数均落入两倍的估计标准差内,并且Q统计量对应的P值均大于置信度0.05,故该序列在5%的显著性水平上不存在显著的自相关。
第三步:
单位根检验
图6.3泸州老窖单位根检验结果
图6.4沪深300指数单位根检验结果
由图6.3可以看出泸州老窖的收益率t值为-20.96893,对应的P值与0无显著差别;由图6.4可以看出沪深300指数的收益率t值为-19.84282,对应的P值也与0无显著差别,即两组数据都不存在单位根,都是平稳的序列。
第四步:
协整检验
图6.5协整检验结果
由图6.5得出ADF检验的统计值为-20.44953,其值小于1%-10%显著性水平下的临界值,且从E(-1)的系数的显著性来判断,E(-1)的系数也为零,因此认为泸州老窖和沪深300指数存在相互协整关系。
第五步:
格兰杰因果检验
图6.6格兰杰因果检验结果
由图6.6可以看出“SHANGdoesnotGrangerCauseZHAO”对应的P值大于5%,表明在5%的显著性水平下接受了该假设,即沪深300指数不是引起泸州老窖变化的原因;“ZHAOdoesnotGrangerCauseSHANG”对应的P值也大于5%,表明在5%的显著性水平下接受了该假设,即泸州老窖不是引起沪深300指数变化的原因。
结果分析:
本项目选取了泸州老窖及大盘沪深300指数,分别计算了超额收益率,然后用一元线性回归估计除了β值。
首先进行了自相关检验,得出在5%的显著性水平上不存在显著的自相关;然后进行了单位根检验,可知两组数据都是平稳的序列;接着进行了协整检验,得出泸州老窖和沪深300指数存在相互协整关系;最后进行了格兰杰因果检验,得出沪深300指数不是引起泸州老窖变化的原因,且泸州老窖也不是引起沪深300指数变化的原因。
项目五:
VaR模型
一、相关理论分析
传统的ALM(Asset-Liabil