财新传媒
位置:博客 > 何诚颖 > 中国A股市场风险因子模型中的行业因子分析(上)

中国A股市场风险因子模型中的行业因子分析(上)

1引言

由于近年来中国经济的高速成长和中国股票市场的快速发展,中国A股市场吸引了大量个人投资者和机构投资者的关注。如同其他新兴股票市场一样,中国A股市场存在着潜在的投资机会,也蕴藏着巨大的风险,中国A股市场的收益波动之高就是实证,因此很有必要对中国A股市场建立相应的风险因子模型来管理投资风险。但这并非易事,中国A股市场的风险水平不仅非常高,而且其波动也非常大,这主要来自于政策的改变和市场的扩张,持续地影响着整个市场环境。每年都有大量的新上市公司,A股市场在2005年才1300多家上市公司,现如今已有2300多家,短短7年内上市公司数量增长超过70%。A股市场持续不断的发展与转变使得很难通过揭示股票市场历史的风险来预测未来。但利用更高频率的数据进行风险预测则能缓解这一难题。比如分析日数据而不是月数据,信息量大约增加了20倍,这样就能对更快地识别环境的改变。MSCI Barra第二代中国模型通过使用日收益率数据得到显著的改进,不像第一代模型使用月数据那样难以迅速捕捉到市场变化,新一代Barra中国股票模型更是开发出日频率的风险监控模型。

基于投资风险的重要性,本研究报告将探讨风险因子模型及其在中国A股市场的应用。在接下来的篇幅中,我们将首先简述股票风险因子模型的思想,然后分析中国A股市场风险因子模型的行业因子。股票风险因子模型中的因子揭示了所有股票收益的来源,主要包括两大类,一类是行业因子,反映的是来自于行业层面的风险,另一类是风格因子,则是非行业的其他共同风险,称之为风险因子。本研究报告将对中国A股市场的行业因子进行分析。最后给出相关结论。未来的研究中将会进一步对风格(风险)因子进行分析。

2因子模型简述

2.1因子模型的必要性

股票组合的风险一般定义为组合收益率的标准差,用来表示,它取决于组合中各股票之间的相互关系。如果用表示股票组合中所有股票收益率的协方差矩阵,那么股票组合的风险可表示为:

                                                                                                                  

其中是股票组合各股票权重的列向量。如果第1个股票资产价值占到整个投资组合价值的10%,那么的第1个元素。如果某个股票不在股票组合内,则相应的权重为0。

因此利用所有股票收益率的协方差矩阵,我们就可以预测所有股票投资组合的风险。但我们难以直接准确地估计出协方差矩阵。假设市场上有个股票,那么协方差矩阵是一个的对称矩阵,如果直接采用收益率数据来估计协方差矩阵,有个参数需要估计。假设,则参数的个数为50.5万。如果利用历史日数据来估计,我们至少需要收集这1000个股票的超过500天的数据,为了使估计更为准确,通常需要的数据量更长,可能是10年的数据。在一个成熟市场,也未必能收集到如此多的数据,而对于新兴市场来说,则是基本不可能的任务。另外,直接采用历史收益率数据来估计协方差矩阵可能会犯一个严重的错误。比如一家公司在某一天报告了丰厚的盈利,使得其股票大涨,而碰巧也是在同一天,另一家公司出现了丑闻,使得股票大跌,这种历史上的巧合会使得我们认为这两家公司的股票是相互对冲的,但实际上他们并不是。

为了让风险预测更为准确,我们在预测协方差矩阵时需要更为有效地使用数据。风险因子模型就是这样一种方法,同时它还能减少历史偶然性对风险预测的影响。风险因子模型认为资产收益率来源于一些共同因子。因子暴露将因子收益与资产收益率联系在一起。因子模型将股票收益率分解为:

                                                                                                                   

其中阶列向量,表示个资产的收益率,它可以分解为共同因子部分和特殊收益部分,其中共同因子部分为的因子暴露矩阵与的因子收益列向量的的乘积。如果因子模型表现好的话,每个资产的特殊收益部分在统计上应该相互独立。因此资产组合中的单个资产特殊收益的风险将会被分散掉。资产组合中的资产数量越多,资产组合的单个资产特殊收益的风险就越少。因子风险必须通过控制资产组合的因子暴露来对冲掉。

因子模型的风险预测为:

                                                                                   

因子模型将资产协方差矩阵分解为共同因子部分和特殊部分。其中涉及到共同因子收益率的协方差矩阵的预测和特殊收益率协方差矩阵的预测。共同因子收益率协方差矩阵与所有资产收益率协方差矩阵相比非常小(),从而在进行预测时需要的数据量要少很多。特殊收益率协方差矩阵是对角矩阵,只有个非零元素需要预测。因子模型的这种结构设定,大大减少了需要预测的参数的个数,因此能够有效地利用可得的数据来预测资产收益率之间的相互关系。

2.2风险因子模型

模型中的因子反映的是性质相同的资产将会有相近的收益,股票的一个重要性质就是它所属的行业,比如,我们认为一家IT公司的股票价格的走势会与同是IT行业的公司股票的价格走势更为相近。为了反映这一点,我们设定每家IT公司的股票对IT行业因子的暴露,而其他行业的公司股票的暴露,对它对所属行业的因子暴露为1。不同行业之间股票收益率的相互关系则体现在因子协方差矩阵中。

利用股票的其他性质,比如股票估值(通常用市净率或市盈率来表示)和公司规模(通常用公司市值或资产的自然对数来表示),我们也可以将股票分成若干组来反映相同组内公司的股票价格走势具有相近的趋势。这些非行业的风格特征的因子则称为风险因子。

2.3因子回归方法

为了预测因子收益率的协方差矩阵,我们需要知道因子收益率的历史数据,而它则是通过截面多变量回归的方法从资产收益率中提取出来的。

回归所用到的一组资产称为估计集(Estimation Universe or ESTU)。比如,在Barra第二代中国模型中,估计集包含了所有上市交易超过1个月的A股,但把最近12个月曾经被PT或ST的股票排除在外。在确定了估计集后,我们用回归方法估计出因子收益率来最好地解释资产收益率,即估计出来的因子收益率要能最小化如下的加权残差平方和:

                                                                                    

其中求和是对估计集中的所有资产进行求和。回归权重与A股流通市值的平方根成正比,但对于权重特别大的极端值,我们将其设定为所有权重95%分位数的水平。这种加权最小二乘法(WLS)能确保最重要(流通市值大)的资产的收益率对因子收益率的影响最大。在估计风险因子收益率的情况下,该方法也能保证因子收益率是从大量股票收益率中估计出来的同时,不会被一些非常有影响力的股票的个股特殊收益率所干扰。



推荐 15