基于商品期货的统计套利策略（二）

3 统计套利模型构造

如前所述，对于各类商品我们主要考虑跨期与跨品种两种套利模型的构造。我们即分别对跨期套利与跨品种套利两者模式展开讨论和考察。

3.1 跨期套利

合约之间价格走势的偏离波动是进行跨期套利的基础。跨期套利仅仅涉及两个合约之间的买多/卖空操作，较于期现套利、跨品种套利等策略操作更为简单。

理论上，我们认为期货的价格可以表示为其标的(现货)价格与时间的函数，即可以认为期货价格满足一个Ito过程，

， (1)

其中为一Wiener过程，、为价格变量和时间的函数。根据Ito引理，若价格变量满足Ito过程(1)，则有关与的函数满足，

，(2)

假设、为某商品不同月份合约的价格，则相应价差即为，

， (3)

考虑期货价格与现货之间的关系，

， (4)

于此，我们即可进一步考察价差变化的极值情况

, (5)

依据式(5)关系，我们即可以判定价差极值变化。而根据价差与现货价格的二阶关系，我们则能够进一步确定价差的极值情况，

, (6)

结合(5)与(6)，我们即可以判定价差为极小或极大情形。事实上，式(5)反应的是合约之间的强弱对比，若其值接近于零即说明两个合约强弱渐趋平衡，相应地即会出现合约间的强弱转换。

也就是说，跨期套利的出发点即是捕捉合约间强弱的偏离。显而易见，合约之间的强弱切换即影响着价差的波动起伏，对应着一种典型的均值回复过程。对此，我们可以进一步分析、检验价差的波动变化与均值回复过程之间的关系，

，(7)

其中即为均值回复速率，、分别为该过程的均值和波动率，则为服从标准正态分布的Wiener过程。可见，随机方程式(7)所描述的均值回复过程即对应为Ornstein-Uhlenbeck过程。我们在报告《基于Ornstein-Uhlenbeck过程的交易规则》中详细讨论了Ornstein-Uhlenbeck过程参数估计与校准等问题，通过估算参数、和，我们即可实现相应交易规则的设置，实现整个策略的构建。而进一步结合合约强度的均衡关系式(5)-式(6)，我们可以优化买/卖触发的设置，提高交易胜率与盈利性。

3.2 跨品种套利

各商品之间存在直接、明显的经济关联，也存在一些隐含、复杂的关系。因此在策略构建上，我们可以直接利用商品之间的经济关联进行套利关系的构建，也可以通过统计方法挖掘商品之间隐含的经济关联，构建统计“错价”关系。

A. 显式策略(Explicit Strategies)

随着国内期货市场的完善，使得同一产业链条上的品种不断增加，使得跨品种套利机会成为可能，比如农产品之间，化工产品之间，以及前述所讨论的大豆、豆粕与豆油之间的套利，焦煤、焦炭与螺纹钢之间套利等。在这里，我们以玻璃与螺纹钢，焦煤、焦炭与螺纹钢为例概要地讨论几个品种之间显式策略的构建。

从上下游关系看，燃料油与玻璃之间存在跨品种套利的可能，但是燃料油期货交易极为冷淡，近乎名存实亡。然而，玻璃作为重要的建筑材料，与螺纹钢具有显著的产业相关性。我们选择自玻璃期货上市日2012年12月3日至2013年6月14日期间主力合约与同时段螺纹钢主力合约的日数据，计算表明两者的相关系数可达0.71。需要指出的是，随着上市时间的变化，玻璃与螺纹钢之间的相关性并不稳定，相关系数在0.6-0.9之间变化。

焦煤、焦炭与螺纹钢在产业链上分别属于上中下游的关系。炼焦煤行业处于产业链的前端，通过洗选、炼焦得到焦炭，而90%以上的焦炭则用于高炉炼铁，焦炭约占钢材成本的20%左右。我们同样选择焦煤、焦炭以及螺纹钢期货主力合约的日数据进行相关性检验，发现焦炭与螺纹钢之间的关联系数可达0.97，焦煤与焦炭之间的相关性则为0.95，焦煤与螺纹钢之间的关联系数则为0.94。因此，无论从产业关系还是商品的价格关系，我们均可确认焦煤、焦炭与螺纹钢三者之间存在高度相关性。因此，对三者进行相应跨品种套利策略的构建在产业关系与交易特性上均具有较强的事实基础。

上述两个具体实例即表明从产业关系出发构造显式套利策略的可行性。由此，我们可以采用协整或分步协整方法对各商品之间进行相应的价差关系构建。具体地，我们选择日交易数据进行回归分析，检验协整关系的稳定性，进而分析价差关系的变化与统计特征，通过O-U过程的工具进一步考察商品间的套利交易规则。也就是说，我们可以进一步结合跨期套利相关交易规则的设定方法，回溯检验套利策略的优劣与统计特征。

B. 隐式策略(Implicit Strategies)

由第2节讨论可知，当前国内商品期货市场较活跃的品种共有17种(以月均成交额占比1%为界)。在跨品种套利考察中，我们即考虑上述17种交投较为活跃的品种，同时根据交易频率、考察周期等进行删减选择。若将不同商品资产在任意时间内的收益记为，为同一期市场可能的收益，我们可以将其收益分离为整个市场贡献与个体资产特征的贡献，即有

， (8)

更一般地，我们可以将资产收益分解为多个共同因子的贡献，即多因子模型的框架下，上式可以表示为，

， (9)

其中，我们可以将个因子解释为某一基准组合对应的因子，如市场中的不同风险。在统计套利模型中，我们希望模型荷载的资产组合为市场中性，即组合中每一资产的投资金额应当实现“多”-“空”平衡，即

(10)

对应为资产组合收益在不同因子上的分解即说明模型中的资产收益与市场因子无关。于是，套利模型对应的收益为，

, (11)

因此，对于统计套利模型，其收益即仅仅来源于各资产的个体特征收益。显然，对于上述模型，一个核心关键问题是因子如何定义和构建？在相对值建模，如协整方法中，我们即选择资产本身作为因子的代理量实现策略的构建。同样地，我们可以对历史收益数据进行统计分析，构建相应的市场(系统)因子。在本报告中，我们即采取后一种方法，通过分析个不同资产的历史数据，选取合适的资产组合构成。具体地，任一给定时间，之前期的历史收益即为，

(12)

其中为资产在时刻的价格。同时，考虑到不同资产有较大的波动差别，我们进一步对收益序列进行规整，

， (13)

其中，

，。

因此，资产间的关联矩阵即为，

， (14)

于此，即可以根据市场中可选择的品种数目构造相应的关联矩阵。我们在报告《RMT理论与金融资产相关性》中详细地讨论了资产关联性分析的要点，即一些特征的组合能够贡献大部分的市场波动。为此，我们在本报告中采用主成份分析(Principle Component Analysis, PCA)研究资产间关联性特征向量的演进、变化，以及基于此的交易策略。

在主成份分析中，我们即得到资产间的关联矩阵特征值与特征向量。将特征值按降序排列，

， (15)

同时将对应的特征向量记为，

, (16)

对应地，我们可以考察市场关联矩阵的特征值分布，

， (17)

在报告《RMT理论与金融资产相关性》中，我们对关联矩阵的特征值分布进行了梳理和讨论，指出金融资产间关联矩阵的大多数特征值表现为连续“热噪声”，而其他偏离成份则具有较高的统计显著性。因此，在统计套利对应的因子构造中，我们即重点考察这些偏离成份的特征向量。

在考察中，我们可以选择固定的特征向量数目，或者根据估算日期的不同选择可变数目的特征向量。根据这两种方法，我们即能够分别考察因子固定或者一定波动性下的策略构建。

于是，根据上述讨论的特征值，，我们对应地构建“特征组合”，而组合中每一股票分别投入的资金份额比例为，

于是，特征组合在时刻相应的收益为，

， (18)

容易证明，时，相应特征组合的收益与关联度为零。

在报告《RMT理论与金融资产相关性》，我们讨论了这些主导特征向量的特性。特别是，最大特征值对应的特征向量即是所谓的“市场组合”，它反映的是整个市场对应的风险，因此该特征向量系数均为正，而该特征组合同样具有正的权重。需要指出的是，这一权重与对应资产波动性成反比。

而其他特征向量(或特征组合)，为了避免与“市场组合”相关，对应的成份系数必然有负值。同时，我们进一步将组合中系数进行降序排列，即

序列即对应为重新排序标记的资产。根据这一处理，我们容易发现邻近的资产倾向具有相近的属性。这一特征，本质上与物理的“相干”(Coherence)类似，我们可以将之称为资产关联的相干性，对于不同高阶的特征向量均成立。当然，对于噪声谱对应的特征向量，该特征将表现显著的偏离。我们即可以方便地基于这些特征组合实现多-空头寸。

4 跨期套利策略设定与回溯检验

如前所述，不同合约之间的流动性直接决定着跨期套利交易执行与成交的可能。合约之间没有相比拟的深度和广度，套利的规模、建仓、出场等均容易出现问题，账面利润和实际利润会有较大的出入，甚至账面利润转变为实际亏损。因此，分析、对比合约之间的成交量信息是部署、构建跨期套利策略的基础。我们在表3统计、总结了市场交易较活跃商品主力合约与次主力合约的成交占比情况。容易发现，不同品种、不同月份合约间的成交占比有着较大差异。原则上，主力合约与次主力合约之间流动性的差异取决于合约的品种、“交割”、“移仓”等因素。显而易见，次主力合约的交易活跃程度决定了跨期套利策略的可行性。在策略构建中，依据应用场景的不同，我们可以选择不同频次的成交量分析合约的交易活跃特性，结合买卖价差(Bid-Ask Spread)、TWAP或VWAP等算法等考察并预测合约的流动性。

跨期套利策略中，我们对称地买多、卖空两个不同合约，因此策略构建最核心的变量即是两合约之间的价差。通常，价差即等于两合约之间的收盘价之差。然而，收盘价是否可以在不同交易场景(高频场景下尤其如此)作为一个合适的表征量仍然是学界与业界考察探讨的重点。在本报告中，我们将简单地选择合约收盘价进行价差的构造和分析。对于合约的选取，根据前述的讨论，我们即通过交易成交量的历史记录判断、区分主力合约与非主力合约，选择同一品种流动性最好的两个合约进行策略的构建。而考虑流动性对策略成交执行的影响，我们根据考察周期的不同，细致考察分析合约成交量在不同周期内的波动变化，动态地更新、调整策略交易执行的设置。

4.1 跨期合约价差统计特征

图4. 2010/07/01-2010/07/07螺纹钢主力与次主力合约价格走势以及相应价差变化

图5. 2013/04/22-2013/04/26螺纹钢

主力与次主力合约价格走势以及相应价差

在图4、图5中，我们对应抽取了螺纹钢不同时期主力合约、次主力合约10秒高频价格以及两者之间的价差变化与分布。对比两图结果，我们容易发现合约价差在不同时期有着显著的差异：2010年7月期间合约价差均值为-139.45即远期合约升水，标准差为11.20，同时价差的分布显著表现出双峰的非标准统计分布特征；2013年4月末合约间价差的均值则变为20.12即远期合约贴水，标准差为2.52，而价差的分布则表现为单一峰度的特征。显然，市场套利者的增加使得合约价差波动显著减小，相应套利机会也随之减少。同时，我们也发现不同时期合约价差表现出不同的微观特征，2010年7月期间合约价差有着跳跃线形，而2013年4月末的合约价差则表现较为平稳。这一变化实质反应投资者结构、价格形成机制等若干市场特征发生了变化，随着品种运行时间的增加，更多套利者(投机者)的加入使得市场可套利机会减少、定价机能更为合理、迅速。

因此，价差在不同时期的统计特征直接影响着策略的构建与实施的绩效。早期市场由于缺乏套利者等参与，市场有着较多的套利机会，但市场同时发现机能、市场效率等影响也使得市场“错价”被修正的统计特征不够明显。而一旦市场成熟，价差收窄，有着更为稳定的统计特征，但同时套利机会亦减少。因此，如何在市场不同时期部署相应的策略是套利交易实现稳健收益的关键。

4.2 跨期策略回溯与绩效表现

基于上述讨论，我们即实证地考察、分析几个特征商品期货与股指期货的跨期套利的策略回溯与检验。考虑到流动性等制约，对于跨期价差(Calender Spread)则我们即选择主力价差。然而，不同商品主力合约的月份并不一致，如有的是当月合约为主力合约，也有的是隔季合约为主力合约。因此在价差构造上，我们需要结合成交量进行判断。

原则上，为了保证交易的可执行性，我们需要进一步根据交易频度与次主力合约的成交量分析策略的容量。简单起见，每次套利触发即仅开仓1手。收益率的计算则依据单次价差获利点相对于保证金的比率。具体地，假设开仓时合约价格分别为、即对应的跨期价差；平仓时合约价格为、，此时价差即为，而保证金比例为M。若进行的是正向套利，即买多价差，此时收益率为；若反向套利即卖空价差，相应的收益率即为。因此，最终的累积收益即为期末损益与初始资金的比率。在交易成本的设置上，我们简单地将交易佣金与冲击成本设置为万分之一。而各商品的保证金比例不等，在6-12%区间上下浮动，我们在考察中即根据具体的商品进行合适的设置。

同时，我们假定交易的场景为日内交易，所有交易的买卖触发均在日内完成即收盘的前3分钟内不触发价差的买入信号，只触发价差的卖出信号，若收盘前一时刻仍有头寸则以当日收盘价卖出。也就是说，在策略回溯中我们不持有任何过夜头寸。

我们即具体地对螺纹钢与豆粕两个品种展开策略的回溯与绩效检验：

螺纹钢

螺纹钢保证金的比率设置依据合约上市时间的不同而变化，挂牌月为7%，交割前一月为15-20%不等，交割月则为30%。正因如此的保证金规则，使得螺纹钢的主力合约通常为隔季合约而不是当月合约。因此，我们在策略回溯检验中假定保证金比率恒为20%。螺纹钢的合约乘数为10，以其价格中轴4000元为估值，我们即假设初始资金为5万元，同时盈利不追加投资。对比分析合约的流动性以及可获得的高频数据，我们回溯考察的区间即设定为2010年6月28日至2013年4月30日，以10秒高频数据进行回溯检验。

图6. 201

0/06/28-2013/04/30 螺纹钢跨期套利策略的绩效曲线

如图6所示，我们给出了2010年6月底至2013年4月底期间螺纹钢主力合约与次主力合约之间的跨期套利策略绩效表现。在近三年共计688个交易日中，该策略的累积收益高达627.10%，平均年化收益率为101.4%，年化平均复合收益率为70.0%，而相应的年化Sharpe比率则为20.4(每年假设共有252个交易日)，最大回撤为-0.2%。

我们进一步在图7中给出了该策略的胜率表现以及每笔平均盈利的分布变化。显而易见，这一策略具有较为稳健的胜率表现，绝大部分交易日的胜率可保持90%以上，最差表现的胜率亦有58.8%，在回溯区间内该策略的平均胜率则为90.4%。而对于单笔平均盈利，我们也容易发现绝大部分交易日的单笔平均盈利集中在10.0元附近，均值为12.4元(以实际保证金比例计算约为0.07%，以初始保证金计算则为0.024%)。在回溯期间，表现最差的交易日其单笔平均亏损可达-17.06元，表现最好交易日的单笔平均盈利高达55.40元。统计上，这一策略单笔平均盈利分布的标准差为8.65，偏度为0.91，峰度为5.34，即该策略绩效表现出显著的右偏特征。而从交易频次来看，这一策略日均交易次数约为35次，交易次数最高的一天可达84次，最低的一天则为17次，在688个交易内一共触发了23996次买卖交易。因此，平均来看该策略的交易频率并不高，平均6分钟完成一次买与卖的交易，即便在交易频率最高的场景下，该策略的平均周转率也达2.50分钟。当然，考虑到交易触发的分布并不均匀，真实的持仓交易时间应该更为短。因此，实际的交易部署应当综合地考虑交易通信的延迟对交易绩效的影响。

图7. 2010/06/28-2013/04/26 螺纹钢跨期套利策略胜率与每笔盈利分布

毫无疑问，交易的手续费是制约统计套利策略绩效表现最为关键的一个因素。在上述回溯中，我们设置开仓、平仓的交易费用万分之一(1.0%%)，略高于市场的平均水平(0.6%%)。如图8中，我们给出了区间内交易费用的分布结果。显而易见，单笔交易的平均手续费高于12.0元即前述的单笔平均利润，其均值为17.15元。因此，对于统计套利策略，进一步提高优化策略在执行过程中的滑点，是控制策略盈损的关键。为了更具体地说明这一要素，我们进一步将交易费用提高至1.5%%，回溯结果表明该策略的累积收益衰减至217.01%，最大回撤高达-3.12%，年化Sharpe比率为8.4，如图9所示。若进一步将交易费率提高至2%%，则该策略将出现大幅的亏损。当然，我们也可以进一步调整交易触发阈值等参数，降低触发的频次，稳定交易胜率以实现最优的参数设置，这也是我们进一步考察、分析的重点。

图8. 2010/06/28-2013/04/26 螺纹钢跨期套利策略交易手续费与单日平均手续费

分布

图9. 2010/06/28-2013/04/26 螺纹钢跨期套利策略

的累积收益(手续费为1.5%%)

豆粕

豆粕期货是大商所交易最为活跃的农产品，其合约规格为10吨每手。保证金比例较低，交易所最低要求为6%，而手续费则为每手2-3元。因此，我们在策略回溯检验中假定保证金比率恒为20%，豆粕期货的合约乘数为10，以其价格中轴3500元为估值，我们即假设初始资金为2万元，同时盈利不追加投资。同样，详细地对比和分析合约的流动性以及可获得的高频数据，我们即设定回溯考察区间为2010年6月01日至2013年4月30日，以10秒高频数据进行回溯检验。

如图10所示，我们给出了2010年6月01日至2013年4月30日期间豆粕主力合约与次主力合约之间的跨期套利策略绩效表现。在近三年共计704个交易日中，该策略一共触发41235次买卖交易，累积收益达980.5%，年化平均复合收益率为126.0%，而年化Sharpe比率则为13.8，最大回撤为-6.8%。

图10. 2010/06/01-2013/04/30豆粕期货跨期套利策略的绩效曲线

与前述讨论类似，我们在图11中分别给出了策略的胜率表现以及每笔平均盈利的分布变化。与螺纹钢所不同的是，该策略在豆粕上的表现出更大波动变化，其胜率出现一定的退化，但仍然较为稳健，绝大部分交易日的胜率保持在75%，在回溯区间内该策略的平均胜率为71%。而对于单笔平均盈利，我们也容易发现绝大部分交易日的单笔平均盈利集中在5.0元附近，均值为4.1元(以初始保证金计算则为0.021%)。在回溯期间，表现最差的交易日其单笔平均亏损可达-33.70元，表现最好交易日的单笔平均盈利高达25.81元。统计上，这一策略单笔平均盈利分布的标准差为5.88，偏度为-2.03，峰度为11.98，即该策略绩效表现出显著的左偏特征。而从交易频次来看，这一策略日均交易次数约为58次，交易次数最高的一天可达237次，最低的一天则为1次。

图11. 2010/06/01-2013/04/30 豆粕期货跨期套利策略胜率与单笔平均收益分布

图12. 2010/06/01-2013/04/30 豆粕期货跨期套利策略交易手续费与单笔平均

交易费用分布

在图12中，我们对应地给出了交易手续费的分布概况。考虑豆粕交易的手续费按每手收取，而在回溯中我们设置的交易费用为万分之一，高于市场平均水平(2.7元每手)。显然，我们可以优化设置交易手续费用，进而提高策略的绩效表现。

5 结论

我们概要地总结了国内各商品期货的发展与现状，分析了各品种的流动性与交易活跃特征，考察了各品种合约间的变动与交易活跃度。进而，我们详细地讨论了统计套利策略构建的出发点，梳理分析了跨期套利、跨品种显式与隐式套利策略构建的基础模型，考察并分析了交易规则的设置逻辑，并通过10秒高频交易数据实证回溯检验了跨期套利策略在螺纹钢、豆粕两种商品上的绩效表现。我们的回溯结果表明跨期统计策略具有稳健盈利的能力，平均胜率稳定地高于70%，平均年化收益可达100%，年化Sharpe比率则数十倍，同时策略表现出较强的品种适应性。在后续考察中，我们将详细地讨论不同交易规则回溯对策略绩效的影响，实现并分析跨品种策略的绩效表现。

话题：