量化投资模型系列之GARPWord文件下载.docx
《量化投资模型系列之GARPWord文件下载.docx》由会员分享,可在线阅读,更多相关《量化投资模型系列之GARPWord文件下载.docx(16页珍藏版)》请在冰点文库上搜索。
V:
以
PE-PB-PCF
为价值因子
B、成长模型
G:
EBITG-NPG-MPG-GPG-OPG
为成长因子
C、质量模型
Q:
ROA-ROC-GPM-CRAR-CNPR-TAT
为质量因子
1.1、选股方式——
自下而上选股
基本选股模型采用指标打分的方法来筛选股票。
首先对待选股票
的各个指
标分别进行排序打分,然后将股票对应各个因子的指标得分
进行求和,最后以总得分大小来筛选股票和构建组合。
具体步骤如下:
第一步:
确定待选股票池。
选择组合构建时点(每个月最后一个
交易日收盘后)上市满两年的全部
A
股股票,考虑实际投资需求,剔
除当日停牌的股票,剔除最近四个季度滚动净利润为负值的股票,剔
除连续
个交易日平均成交额小于
100
万元的股票后,以剩余股票作
为待选股票池。
第二步:
构建股票组合。
a)
指标打分:
首先将待选股票池中股票分别按照属性因子的各
个指标进行排序(价值指标从小至大,成长指标和质量指标从大至小)
,然后采用百分制整数打分法进行
指标打分,即以股票在各个指标排
名中所处位置的百分数作为股票对应该指标的得分,前
1%得分为
1,
依次递减,最后
100。
b)
求和排序:
将股票相对于同一属性的各个指标的得分进行等
权重求和,将总得分进行从小至大排序,选择排名靠前的
N
只股票进
入量化组合。
c)
构建组合:
采用等市值权重构建相应的量化组合(采用等权
重的方法可以比较选股效果的优劣,在实际的投资中也可采用其他权
重)。
第三步:
组合调整。
我们对组合进行逐月调整(调整时扣除相应
的交易税费,暂不考虑冲击成本),即持
有组合至次月最后一个交易
日,利用更新后的指标数据重新确定待选股票池,重复第二步打分、
求和过程,并将股票按照指标得分和值从小至大排序,将原来量化组
合中排名跌出前
名的股票卖出,买入新进前
名的股票,同时将新
组合内样本股的权重调整至相等。
第四步:
统计检验。
分别计算各组合每个月收益情况,以沪深
300
指数作为比较基准,利用
t
检验考察各个量化组合超额收益的有效性。
价值指标
名称
定义
PE
市盈率
总市值/滚动
12
个月净利润
PB
市净率
总市值/最近报告期净资产
PCF
市现率
个月经营活动净
现金流
并用信息比率、夏普比率和战胜基准频率来比较各种策略的优劣。
需要说明的是:
由于采用自下而上的选股方法,因此在筛选指标
过程中,我们尽量选择那些所有股票均可
计算的指标(比如
ROIC
指
标由于银行类股票不能计算,我们将其剔除,并选择
ROC
指标来替代)
,以避免出现某些行业由于指标无法有效计算而不能被选入的情况。
另外,我们主要选择那些可以明显分别出优劣的指标,以便进行排序
(比如资产负
债率等指标不能通过简单的排序来区分股票好坏,因此
不予采用)。
1.2、价值模型
——寻找估值凹地
量化价值模型寻找低估值的股票构建组合。
在前面的研究报告
《量化
投资系列之价值模型——寻找价值凹地》中,我们以
PCF
单指
标来构建价值模型。
近期,我们重新考虑了包括
PE(市盈率)、
PB(市净率)、PCF(市现率)、PS(市销率)、PEE(一致预期市盈
率)和
EV/EBITDA(企业价值倍数)等在内的六个市场估值指标的选
股情况,并利用
2002
年
月~2009
11
月,接近八年时间共计
95
期数据进行更新测试。
结果表明,以
三个指进行联合打分
选股,所得到的价值组合更加出色和稳定。
表
1:
价值指标及其定义
分别以得分排名的前
20%、10%和
50
只股票构建价值组合,其在
2002.1~2009.11
的测试期内,相对沪深
300
指数的超额
收益均可通过
95%置信度下的统计检验,其中
10%组合和
只组合的统计检验置信
度达到
99%以上。
1.3、成长模型——挖掘成长伏藏
价值指
标
EBITG
息税前收益
增长率
本期滚动
个月息税前利润/上期滚动
月息税前利润-1
NPG
净利润增长
率
个月净利润/上期滚动
月
净利润-1
MPG
主营利润增
长率
个月主营业务利润/上期滚动
月主营业务利润-1
GPG
毛利润增长
个月销售毛利润/上期滚动
月销售毛利润-1
OPG
营业利润增
个月营业利润/上期滚动
12
月营业利润-1
OCG
经营现金流
个月经营性现金流净额/上期
滚动
月经营性现金流净额-1
量化成长模型选择高成长性的股票构建组合,在前面的研究报告《量
化投资系列之成长模型——ROIC-NPG:
挖掘成长伏藏》中,我们以
ROIC-NPG
两个指标来
构建成长模型。
根据我们对各项指标的重新梳
理,现将
列为质量指标,另外构建了包括
EBITG(息税前收益
增长率)、NPG(净利润增长率)、MPG(主营利润增长率)、
GPG(毛利润增长率)、OPG(营业利润增长率)、OCG(经营现金
流增长率)、NAG(净资产增长率)、EPSG(每股收益增长率)、
ROEG(净资产收益率增长率)、GMPG(毛利率增长率)等十个考核
公司成长能力的指标。
根据
月,接近八年的
时间共计
95
期数据的更新测试。
EBITG-NPG-MPG-
GPG-OPG-OCG
六个指标进
行联合打分选股,所得到的成长组合表现
最优。
3:
成长指标及其定义
分别以指标排名的前
只股票构建成长组合,其在
90%置信度下的统计检验,其中
10%组合的统计置信度达到
97%,50
ROA
总资产收益
个月净利润×
2/(期初+期末总资产)
ROC
资本报酬率
个月净利润/(股东权益+长期负
债)
GPM
销售毛利率
个月销售利润/滚动
个月销售收
入
CTAR
现金总资产
比率
个月经营现金流净额×
2/(期初+期
末总资产)
CNAR
现金净利润
个月经营现金流净额/滚动
个月
净利
TAT
总资产周转
个月营业总收入×
2/(期初+期末总
资产)
只组合的统计检验置信度达到
99%。
1.4、
质量模型——甄选优质蓝筹
量化质量模型选择资质优异的公司股票构建组合。
我们从
六
个方面的
财务指标来考察公司的资质,包括偿债能力、经营能力、营运能力、现
金流质量、盈利能力、分红能力等。
采用
ROA(总资产收益率)、
ROE(净资产收益率)、ROC(资本报酬率)、OPM(营业利润率)、
GPM(销售毛利率)、现金流指标、COIR(现金营业收入比率)、
CTAR(现金总资产比率)、CNPR(现金净利润比率)、TAT(总资产
周转率)、LAT(流动资产周转率)等十个指标来进行股票的筛选。
根
据
月,接近八年的时间阶段,共计
期数
据的测试。
六个指标
进行联合打分选股,所得到的质量组合表现最
优。
5:
质量指标及其定义
只股票构建质量组合,其在
95%置信度下的统计检验,其中,10%和
只组合获得超额收益的概
率更高,通过统计检验的置信度
都在
99%左右。
2.
五个衍生模型
2.1、四个叠加模型
通过对股票的价值、成长和质量三个属性因子的指标进行
分类排序打
分,我们分别得到价值模型、成长模型和质量模型三个基本选股模型,
利用这些模型,我们可以筛选出低估值的股票组合、高成长的股票组合
以及资质优
秀的股票组合,从历史统计检验结果来看,这些量化组合
都能显著战胜基准指数。
但是,三个基本模型只侧重股票某一方面的属性,而通过将
三种属性
进行叠加,就可以得到
同时具备几个属性优势的股票组合,例如,选
择价值属性和成长属性同时优秀的股票构建组合,就可以得到价值成长
模型
1。
通过对股票各种属性因子进行联合打分选股,可以得到四个叠
加模型,分别为价值成长模型(VG)、价值质量模型(VQ)、成长质
量模型(GQ)和价值成长质量模型(VGQ)。
根据前面三个基本选股模型的研究结果,这里采用
作为股
票价值属性因子的度量指标;
作为股票
成长属性因子的度量指标;
作为
股票质量属性因子的度量指标。
并以此来构建四个叠加
模型。
叠
加模型的选股流程与基本模型类似,只是在第二步构建股票组合中,
首先需要对待选股票的各个指标进行排序打分,然后将同一属性因子的
指标得分进行相加,即可
得到属性因子得分,再将各个属性因子得分
进行加权求和,就可得到最终的量化分值,最后选择量化分值最小的股
票即可构建相应的叠加组合。
在组合调整时也进行
同样的操作。
图
给出了不同规模股票组合残余可分散风险占比,从中可以看出,
随着组合规模的不断增大,残余可分散风险占比逐渐下降,同时可分散
风险占比的下降速度也逐渐减
小。
二、量化组合及特征分析
1.股票个数选择
股票组合的市场风险由系统性风险和非系统性风险组成,
其中系统性
风险不可分散,而非系统性风险可以通过增加股票个数来减少,即实现
风险分散化。
但是,股票组合的持股数量并不是越大越好。
一方面,当
组合股票数
目增加至一定程度,对非系统性风险的边际降低程度会递
减,而随之带来较高的交易费用及管理成本问题却已开始蚕食组合收益
率;
另一方面数目众多的证券组合中
可能包含一些无法及时得到相关
信息且收益较低的证券,从而增加了及时有效进行投资组合调整的难度。
因此需要在分散风险和提高收益之间寻找一个平衡点。
我们采用
Evans
and
Archer
的方法对组合的分散化程度进行度量。
具体
方法如下:
当组合规模数达到
38
只时,沪深
样本组合的残余可分散风险下降到了
1%以内;
41
只时,中小板样本以及基金持股样本的残余可分散
风险占比下降到了
当组合规模达到
45
只时,全市场样本的残余可分散
风险占比也下降到
1%以内。
由于我们量化组合的股票是从全市场样本中选择的,因此为分散组合风险,
需要将股票个数控制
在
个以上。
而从实际的选股模型对组合股票个数的敏感
性分析来看,当股票个数大于
40
个、小于
60
个时,组合历史测试的业绩表现相
对出色和稳定。
以价值模型为例(见表
9),当股票个数较少时,组合的月均收益
最好,但波动较大,随着股票个数增加到
个以上时,组合的表现趋于稳定,而
当股票个数大于
个后,组合又开始变差。
此
外,从国内公募基金的持股情况来看,其公布的平均持股数量在
只左
右,而实际的重仓股一般控制在
个以内。
综上所述,我们认为,以
只股票来构建量化组合是合适的,既能有效分
散风险,最大获得收益,又能满足基金等机构投资者的建仓和持股需要。
2.十个量化组合
前面,我
们以自下而上的选股方式,构建了三个基本选股模型和五个衍生选
股模型,其指标和参数是通过近
年的历史数据测试分析得出,但是这些指标并
非一成不变,今后,我们每年将对这些选股模型进行定期更新测试,并相应调整
选股指标及相关参数。
根据三个基本模型和四个叠加模型,我们以
只股票分别构建出价值组合
(V50)、成长组合(G50)、质量组合(Q50)、价值成长组合(VG50)、价值质
量组合(VQ50)、成长质量组合
(GQ50)和价值成长质量组合(VGQ50)。
根据交叉深度为
8%和
18%的
GARP
模型,我们分别构建了积极
组合
(aGARP)和稳健
组合(sGARP),这两个组合的股票个数不是固定的,其中,
aGARP
组合统计期间最大持股数为
20
只,最少为
只,平均持股
9
只。
sGARP
组合统计期间的最大持股数为
55
23
37
此外,
考虑到一些中小投资资金的需求,我们利用
VGQ
模型构建了一个只
含有十只股票的
VGQ10
组合。
从历史统计检验上看(见表
11),VGQ10
组合相对
沪深
指数的超额收益可以通过
99%置信度下的
检验,而且从风险收益上看
也表现卓越。
3.组合特征分析
上述十个
量化组合分别来自于八个选股模型,虽然从历史统计检验的角度来
看,各个组合都是有效和可靠的,但由于各个模型本身的侧重点和选股方式不一
样,也使得的量化
组合会产生不同的特点,有着不同的收益预期,适合不同的投
资者。
下面,我们从风险收益特征、组合相关性和市场容量等几个方面对十个组
合进行比较分析。
风险收益特征
从
月到
2009
月近
年的历史月度收益数据来看,十个量
化组合相对沪深
指数均取得了显著的超额收益(见表
12)。
其中,股票个数
较少的
组合和
组合相对沪深
指数的月度超额收益都超过了
2%,它们也同时获得了最高的累计收益,分别达到
1794%和
1485%,远远高于同期
指数
161%的累计涨幅,但同时,两个组合收益的波动性也最大,其年化
标准差分别达到
41.5%和
43.3%。
Beta
系数上看,两个少数股票组合
和
最大,都超过
1.1,
而
Q50
GQ50
两个组合的
值小于
1,其余组合的
值都介于
0.9
1
之间。
从最大涨跌幅度来看,无论是按单月还是半年计算,Q50
组合都是
相对较小的,这与他们的
系数较小有关。
V50
表现相对出色,牛市能涨,
熊市抗跌。
从战胜沪深
指数频率来看,aGARP
组合表现最好,接近
70%,其次是
组合,达到
68.4%,此外,VG50、VQ50
VGQ50
组合也都接近
2/3,只有
G50
组合最差,不到
60%。
如果将组合的投资时间增加,则战胜基准的频率将显著
提高(见表
13)。
从历史测试结果来看,滚动投资组合
年时,十个量化组合均
可在
90%以上的概率战胜沪深
指数,其中持有
组合战胜指数的概率达
到
100%。
如果以会计年度计算组合收益(见表
14),在测试的
年(2009
年为前
11
个月数据)时间里,除了
组合在
2003
年和
V50、VG50、VGQ50
及
sGARP
组
合在
2006
年跑输指数以外,其余年份里各个组合均获得沪深
指数的超额收
益,尤其是
Q50、GQ50、aGARP
四个组合连续八年战胜沪深
指数。
从不同市场行情表现来看(见表
15),十
个组合均可获得相对沪深
数的超额收益。
其中,G50
VQ50
组合在牛市行情下的超额收益要明显大于熊市,
显示出很强的进攻特性;
组合在熊市里的超额收益大于牛市,表
现出较好的防御特性;
四个组合在牛市和熊市里的超
额收益差别不大,但都好于调整行情。
两个组合在三种市场行情
下的超额收益都非常大,不过相对来说牛市行情仍然更为出色。
利
用沪深
指数的历史月度收益率数据将市场分为上升市场和下降市场,
来看不同市场环境下各个量化组合的风险收益特征(见表
16)。
在上升市场中,除
外,其余组合的
Alpha
均大于
1%,其中
组合的
接近
2%。
角度来看,V50、sGARP
以及
的
系数较大,
G50、Q50
系数均小于
由于
系数较小,上升市场中
战胜沪深
的频率都较低,不到
60%,而
V50、VG50
战
胜市场的频率到超过
70%。
在下降市场中,sGARP
均超过
2%,V50
较小,不
0.3%。
角度来看,V50、aGARP、Q50
系数都小于
1,由
于
系数较小,除
外其余
个组合在下降市场中战胜沪深
的频率
都较高。
CQ50
较大而
较小,在下降市场中战胜沪深
的
频率最高,达到
72.97%。
将量化组合的
表示在一个图中(见图
13、14),我们可以明
显看到,下降市场中
组合表现最好,它的
较大,但
较小,这样
即可有效对抗市场下跌风险,又能获得稳定超额收益。
而在上升市场中,应该优
先选择
aGARP、VGQ10、sGARP
等组合,他们不但
大,而且
收益也高,
这样可以在市场上升趋势中更大幅度的超越指数。
组合相关性分析
从绝对收益
角度看,由于
股市场系统性风险较大,各个量化组合也表现
出与市场齐涨齐跌的现象,10
个量化组合只有
与沪深
指数月收益率
的相关系数低于
0.9(见表
17)。
量化组合绝对收益率之间的相关性也较大,除
V50
与
之间相关系数为
0.88
0.89
外,其余组合间相关系
数均大于
0.9。
十个量化组合分别代表不同的风格,所以从相对沪深
指数的超额
收益角度来看,不同组合间的相关性要远小于绝对收益间的相关性(见表
18)。
其中
超额收益间相关性最小,相关系数仅为
0.19。
组合市场容量
由于量化组合对选中的股票进行等权重配置,若组合中包含的某些股票流动
性较差,在实际的投资中可
能会对组合的构建造成一定的影响。
为此,我们根据
木桶原理,以组合中流动性最差的股票所能建仓的资金量来测算组合的市场容量。
对于每一个量化组合,假设组合中流动性最差的股票在构建组合当日所有成
交量全部被买入,则将其成交
金额数乘以组合股票个数即是组合所能容纳的资金
量。
实际中,买入某一股票某天的全部成交量不太现实,投资时可以选择流动性
好的股票当天成交,部分流动性较
差的股票分几天建仓来实现。
假设组合中所有
股票均分
5
天建仓,则建仓期的延长可能对组合的建仓成本造成影响。
经过我们
测算,如果组合中所有股票均分
天平均建仓,则建仓期的延长对组合月平均收
益的影响大约在
个
BP
左右(见图
15)。
用最近
6
个月组合容量的平均值表示当前量化组合的市场资金容量,则
V50、Q50、VG50、VQ50、GQ50
的资金容量均在
7
亿以上,G60
的资金
容量在
亿以上,sGARP
的资金容量在
4
亿间,aGARP
由于包含
股票较少,市场容量均在
亿间。
组合特征比较
参考各个组合的历史表现,我们分别以测试期间的月均收益、标准差、战胜
指数频率来衡量组合的预期收益、波动性和稳定性,以组合历史上不同市场
行情
下的表现来考核组合所适合的市场行情,并以组合市场容量来表示其所能容纳的
投资资金(见表
19)。
从比较结果来看,各个组合各有所长,投资者可根据自
身
情况和市场预期进行选择。
三、总结与组合推荐
总结
我们以自下而上的选股
方式,分别构建了八个量化选股模型,通过不同的参
数选择,构建出十个量化组合。
1)
从历史统计检验结果来看,各个量化选股模型都是显著有效的。
量化选
股的主要目标是战胜比较基准,即沪深
指数,而通过对各个选股模型采用近
八年的历史数据进行实证检验,结果表明这些选股方式是有效和可行的,尤其是
只或较少的股票构建组合时,其相对沪深
指数的超额收益都能通过
99%
置信度下的统计检验。
2)从历史模拟测试效果来看,量化组合的表现是稳定和出色的。
在接近八年
的历史模拟测试中,根据八
大