招商证券:中国量化有着肥沃土壤,新赛道上比拼将更为激烈

财联社(北京,记者高云)讯,招商证券私募基金指数编委会(以下简称“编委会”)最新发表了《中国量化私募基金回顾,归因与展望》。

2020年帷幕落下,私募基金各位大佬各交出了答卷。股票量化作为年内增长迅猛的重要力量,今年收获了不错的成绩单,其中量化多头平均收益34.5%,股票市场中性平均收益11.2%。

编委会注意到三个特征,一是股票多头指数中,今年量化机构相对非量化取得更高业绩;二是股票市场中性指数近两年收益显著提升,今年首次突破10%;三是中国量化规模迎来爆发式增长(注:本文研究范围主要为在中国大陆范围内的量化私募基金)。

是什么成就了量化机构在2020年的业绩与成长,量化未来总体发展走向何处?招商证券私募基金指数编委会从绩效归因的角度解读了量化基金这五年来的发展历程。

指数编委会认为,中国量化还有很广阔的发展空间,核心逻辑在于中国市场散户的比例高,目前和未来一段时间,散户交易特征会为量化策略超额收益提供肥沃的土壤。但在未来,量化基金的收益水平或将下行。量化一定会是在传统风格行业之外的新赛道展开激烈比拼:一是基本面深度挖掘,二是如舆情等另类数据,三是进一步优化模型与提高算力。

“量化”需要严格的纪律性和执行效率

编委会此次研究的对象是中国量化股票私募基金,在对量化展开系统的分析研究之前,需要对量化投资做一个定义。“量化”这个词来源于发达市场中“quant”的英文直译,在中国大陆,对其具体含义的理解实际上存在不少误区。

误区一:量化=程序化下单。这是不准确的,事实上不少量化机构采用手工下单,而传统的公募基金很多是程序化下单的,有成熟的VWAP系统。

误区二:量化=用数量化做投资研究。这也不准确,因为现代的股票投资研究体系几乎全部要用数量化方法的。

误区三:量化=不看个股,不分析基本面。有人说量化就是不像主观投资那样深入个股,研究基本面。这也不完全准确,一些知名的量化机构也是要深入个股分析,只是对调研的深度、频率与非量化机构有区别。

指数编委会认为,量化的核心在于投资决策方式。对于非量化机构而言,虽然也大量使用量化分析、系统下单,但最终更多是人在做投资决策,有一定“艺术”成分。量化机构则使用程序来决策,它更像是一门“科学”,在人去建好模型、给定参数之后,程序来计算最优解。这样在决策过程中少了艺术成分,少了行为金融学的偏误,取而代之的是严格的纪律性和执行效率。

中国量化私募2020年已进入“春天的故事”

编委会此次研究的重点是国内量化私募基金,首先结合市场环境,简要回顾一下中国量化私募的发展历程。

2010年至2013年是小草嫩芽。

国内虽然在2000年后就有量化投资的基金产品问世,但2010年之前只是星星之火。2010年,沪深300股指期货给市场带来了对冲工具,“量化对冲”这个词开始正式走进广大投资者视野,虽然刚开始出现的一些量化对冲产品,从策略而言,并非严格的股票Alpha。

这三年算是量化私募的启蒙阶段,A股市场整体的低迷给量化对冲策略带来了一些机会。市场竞争还不太激烈,策略特点是以中低频alpha为主,简单的信号和基于华尔街经典模型的Alpha框架便足以构建出不错业绩的组合。当然,如果回过头来分析,主要还是在中小市值上暴露赚的钱。这个阶段,各量化机构之间还未出现激烈的“军备竞赛”。但此期间非标业务大量发展,大量信托“保本保收”,使得量化对冲的总体规模一直没有发展到很大。

2013年至2015年市场暴跌前是“杠”上开花。

随着股指期货交易稳步上升,量化开始了第一波蓬勃发展。那时期,中国股市在配资、杠杆的催化下走进一波大牛市,从2014年中的2000点一路上行到2015年中的5000点。海外量化团队陆续回国、《基金法》颁布,以及协会登记备案制度所引领的“阳光化”,让量化机构的团队搭建和产品业绩披露更加顺畅。

这期间,三大因素促成了量化对冲进一步成长壮大:一是牛市带来的市场波动(2015年沪指波动率水平40%几乎为近5年最高),为量化策略的运行提供了肥沃的土壤;二是上证50、中证500股指期货、50ETF期权、融资融券等金融工具上线,为量化机构做对冲提供了更多选择;三是配资、杠杆监管相对宽松,许多量化私募使用杠杆来放大收益,做大了管理规模,这一阶段,戏称为“杠”上开花。

2015市场暴跌后至2016是凛冬将至。

2015年,大家追剧《权游》,等待“Winter is coming”,没曾想到资本市场也是凛冬将至。

年中暴跌,沪指从5000点一路下跌至2016年初的3000点。对于量化来说,比市场暴跌影响更大的是随后而来的股指期货监管措施。日内开仓限制到10手,保证金比例提高到40%(套保20%),使得股指流动性瞬间消失,进入深度贴水状态,中性策略进入寒冬。这算是量化爆发增长后面临的第一次严峻挑战。

不能叫把监管政策称作“祸”雪上加霜的是,,2015年市场暴跌及HOMES等系统违规配资事件,引发了监管叫停程序化接口。市场暴跌前,量化管理人通过对API封装对接券商柜台系统,交易执行效率比较高。这种模式的叫停在一定程度上制约了量化策略的运行。

2016年1月沪指暴跌23%,熔断,随后一整年内行情走向了漫漫修复之路,直至年终也未完全收复熔断失地。15年下半年的深度贴水让一些量化对冲策略产品转为指数增强,但指数在市场暴跌、熔断期间挖下的大坑,让这些产品难有惊艳的业绩。这一时期,唯有频率的提高能显著提升量化产品风险调整后的收益水平。通过高换手来降低组合在单因子上的敞口暴露时间,进而降低净值的波动与回撤。Alpha+T0模式逐步进入市场,通过叠加日内价差收益来对抗负基差。

指数编委会认为这算是中国量化私募基金算力与人才比拼,“军备竞赛”的开始。

2017年至2018年是“傲雪凌霜”。

“在隆冬,我终于知道,我身上有一个不可战胜的夏天。”Albert Camus曾经说过。

深度贴水环境的持续,使得量化机构开始历练、进化、洗牌。早年间专注自营,闷声赚大钱的团队开始进入市场,而不少已有不错规模的机构则因为无法满足客户的收益预期而经历规模下滑。随着算力、数据挖掘技术的不断提升,以“四大金刚”为代表的头部量化私募规模开始直线上升。行业集中度呈现提升趋势。

2017年沪指继续修复,上行7%,但贯穿整年的大盘蓝筹行情使得沪指与300的表现出现较大分化:沪深300全年超过20%。如此巨大的市场风格分化,让许多暴露在小市值因子上的组合遭遇回撤。这也让市场开始意识到,一些中性产品并不是真正的中性,而是靠暴露在特定风格因子或行业因子来博取超额收益(虽然2014年底A股市场的类似风格切换也曾让量化对冲出现集体回撤,但其影响远无2017年这次深远)。

2018年市场整体下行20%以上,两市交易量水平(日均)也继续下行到2000亿以下,给高速进化中的中国量化私募基金带来新一轮挑战。僧多粥少,价量因子长时间横盘,量化管理人逐渐觉得难受。出路主要有三个,一是转型对基本面因子展开挖掘,二是研发如舆情之类的另类数据,三是进一步优化模型与提高算力,解决价量因子生命周期短的问题。综合起来分析,数据来源的扩充、策略的进一步个性化、频率的进一步提升是这一时期量化管理人进化的主要方向。

2019年至2020是“春天的故事”。

2019年,资本市场迎来牛市,三大股指全年均超过20%。随着两市交易量的回升,股指期货政策松绑、两融标的范围扩充等利好消息,量化管理人逐渐嗅到了春天的气息。

其中,股指期货开仓限制从50手一次性调整到500手,可谓重大利好,而两融标的扩充到1600只也让量化对冲有了新的对冲方式,长期来看这将使得量化策略种类更加丰富,容量也更大。

沪指年化波动率回到20%以上,市场逐渐发现还是价量因子好赚钱。中国量化逐渐走入了高频价量阶段。海归的量化团队越来越多,华尔街成熟的模型与算法推动着国内量化朝着分笔交易数据、超短线机会收割的方向演进。机器学习、人工智能这些词早先还只是“四大金刚”等少量头部机构的战略定位,此时已然转变为几乎全部量化机构必谈的关键词。头部机构则在人才、算法、硬件上进一步加大资金投入,提高护城河。百亿量化私募俱乐部不断扩容至十家,领头羊直奔千亿,行业集中度进一步上升(值得一提的是,公募基金领域中也有业绩优异,规模过百亿的股票量化机构。但由于公募量化在产品收费方式、费率水平、T0交易限制、对冲工具使用限制、信息披露、排名考核等方面与私募量化存在显著差异,因此暂不分析公募量化)。

在这个“春天”,谁看到?全行业欣喜的看到,中国量化私募基金无论从规模、平均业绩都有了显著提升。股票中性产品取得超越10%的平均绝对收益,而量化多头由于不受到对冲成本、保证金占用仓位的影响,相对于指数的超额收益则平均在15%左右,优秀机构能进入20%-30%区间。相对于发达市场,这可以算是相当丰厚的收益水平。

那么这些收益来自哪里?接下来使用多因子绩效归因的方式展开研判。

量化基金绩效归因:国家因子是2020年主要收益来源

得益于招证托管绩效平台较早的研发上线了多因子绩效归因系统,招商证券的私募托管团队能够对私募基金在股票端的收益来源进行归因分析。招商证券的多因子绩效系统将股票总收益拆解为country,style, industry , T0, 打新几大类。style factor方面,覆盖了总共12个风格因子,industry则由28个行业因子组成。关于industry的绩效归因研究,将另起文章展开,今天重点分析country,style, industry , T0, 打新(实际上这几类贡献的收益、波动已超过全部股票收益、波动的70%以上)。

以下是各因子在2020年对私募基金股票组合的收益贡献。招商证券将组合分为量化类与非量化类进行对比。注意到,此时招商证券并不对量化多头和市场中性进行区分,重点关注股票端的收益来源。

可以看出,2020年在牛市环境下,股票基金在COUNTRY因子上获利颇丰,形成了主要收益来源。而风格因子由于各机构观点不尽一致,暴露方向和程度各不相同,导致收益金额加总值不如国家因子那么显著。但从加总值还是能看出量化基金与非量化基金相比体现出很不同的特性:

一是非量化基金今年的风格收益主要来自于BETA、DIVIDEND、EARNINGSYIELD三个因子。在今年A股牛市的环境下,持有BETA较高的股票无异于拥有牛市放大器。通过准确判断市场趋势并择时,在行情即将上行(下行)的时候增高(降低)组合的BETA因子暴露,量化与非量化管理人均收获了不错的超额收益。贡献排名第2,3的因子为价值类因子,当股价水平相对于股息、每股收益较低时增加暴露,倘若后续估值修复,组合能够获取正收益。反之亦然。因此,如果把DIVIDEND、EARNINGSYIELD合算为价值因子(VALUE),则可得出结论,非量化组合中价值投资贡献了较多的收益。

发达市场更多使用BOOK TO PRICE作为价值因子的代表,但该因子在中国市场的适用性并不高。

二是量化基金今年的风格收益主要来自SIZE,BETA,VALUE。发达市场长期数据显示,SIZE、VALUE因子能解释整个市场绝大部分的收益与风险,但管理人能否通过准确的暴露方向控制把这部分收益收入囊中,完全是另一回事情。如果用一句计量统计的话来复述就是“解释与预测间存在巨大的鸿沟”。从2020年的总体情况来看,量化很好的赚到了SIZE的钱,这一点非量化并没有做到。而价值因子的超额收益,量化收获的也不错。

三是量化组合中T0收益贡献非常显著,甚至不亚于大部分风格因子。通过日内市场微观结构的把握,基于价量为主的高频数据展开算法交易,是量化机构的重要特征。此外,无论量化、非量化组合在目前市场环境中都能通过打新来有效增厚收益。

除了上述特点外,一个值得关注的特征是,动量因子在过去的一年中并未产生很好的收益。这个在发达市场能贡献显著收益的因子为何会失效?结合过去几年的历史数据进一步分析:

以上是历年中,因子对量化类私募基金收益金额贡献的排名,从中似乎可以窥探到一些中国量化私募基金总体风格特征的演进。

一是SIZE在过去6年以来仍是量化基金的主要风格收益来源,除在2017年蓝筹行情中让私募基金尝到苦头外,其余年份基本都贡献了较高正收益。

二是价值类因子收益贡献有逐渐上升的趋势,但重要性仍显著逊于价量类因子。

三是Beta因子作为“收入放大器”在历年都贡献了稳定的正收益,但残差波动率则在大部分时候对组合是负效用的。

上述数据将量化私募基金总体收益进行了展示、归因。编委会关注到,其中有些特征并不完全符合在发达市场中大家对量化的印象。具体如何解读则各有不同,编委会尝试给出一些分析解读。

“粥多僧少”格局支撑“中国量化还有巨大发展空间”

编委会表示,目前国内的量化总规模估计为5000亿元,与美国还有不少距离,但注意到中国A股市的交易量已经接近美国,这一“粥多僧少”的总体格局不仅是支撑“中国量化还有巨大发展空间”的主要论据,同时也是量化基金收益来源与海外呈现出不同形态的根本原因。除此之外,中国市场的两个特殊性也值得关注。

一是游戏规则不同,作为emerging market,30年历史的中国资本市场还不完全成熟,存在T+1、涨跌停、对冲工具少成本高、高交易成本等诸多限制。且由于资本管制导致与外部隔阂严重(虽然近年来QFII,沪港通等手段在持续改善这一点)。

二是游戏对手不同,散户为主的资本市场结构,使得持股量仅占20%的个人投资者贡献了超过90%的市场交易量(美国则90%,欧洲市场约60%的交易为机构贡献)。

因此,目前中国量化私募基金在策略研发上或许有两个对应的区别,一是模型的建立要考虑到各种交易限制,甚至主要是根据对冲工具、市场摩擦、冲击成本等限制来研发模型及设定参数。二是策略的核心逻辑更多的要基于自然人、针对散户的行为特征来研发,充分研究行为金融学对市场的影响。

例如,从历史数据看到,SIZE因子在中国非常重要,解释了差不多一半的超额收益与波动,在美国却早已呈现出弱化的趋势。美国市场上质量类、盈利类因子有很好的解释性及收益贡献能力,这两类因子在中国市场却并未有同等的重要性。原因可能在于,A股市场中这些因子与size关联度更高,已经很大程度被size解释,相对于size的残差就没有太多解释能力。此外,财务数据的更新频率、准确性也一定程度影响这类因子的能力。

从微观的角度出发,如果组合的收益过度依赖少量因子暴露,那么在市场风格反转时有更大的回撤可能性。从宏观的角度来看,如果中国私募基金整体而言对某些因子有显著暴露(即,大家对该因子未来收益方向的观点趋同),该因子实际上就转为“系统性风险”。或称为拥挤风险(crowding risk)。拥挤风险可能导致不愿看到的危机,例如2007年美国市场的量化危机,很大程度上源于当时市场对短期动量因子的拥挤、同向操作。

其实多因子量化体系的好处就在于投资逻辑和风险的充分分散,正如某量化大佬将多因子量化组合比作大桥钢缆:之所以钢缆由一根根钢丝组成而非整根钢柱,就是因为多根钢丝拧在一起,韧性更强。引申一下这个说法,如果每根钢缆象征一个组合,整个大桥象征全市场,当各钢缆所用的钢丝同质化非常严重时,或许存在着引发共振的风险。当某个因子真正显现出拥挤的时候,只可能出现两种情况,一是因子超额收益变低,甚至为0,暴露该因子无法获得风险补偿。二是因子超额收益仍在,但变得与全市场的资金出入、收益水平密切关联,因子收益方向与全市场收益方向一样难以确定了,也就是“beta化”了。此时是否暴露该因子就转变为风险是否承担或者是否能分散的问题。

中国量化未来空间广阔,将在新赛道展开激烈比拼

指数编委会认为中国量化还有很广阔的发展空间,核心逻辑在于中国市场散户的高比例结构,散户交易行为特征为目前和未来一段时间仍会为量化策略超额收益提供肥沃的土壤。这一点毋庸赘述。但在未来量化继续增长的过程,超额收益水平或将下行。从过去几年来看,量化对冲的平均业绩水平(以及量化多头的超额收益水平)逐年增长,去年达到11%(15%),但未来量化规模的上行必然导致赛道拥挤,僧多粥少;高频等风险调整后收益水平极高、容量有限的策略将逐渐转为自营;当市场发展到均衡状态,超额收益水平或将刚好覆盖管理人的运营成本加投资者正常的风险补偿。

“道可道,非常道”。编委会关注到风格因子、行业因子这类市场已经耳熟能详的常规因子,在私募基金全部超额收益中的占比是稳中有降的。这或许指示出量化在未来越来越难以靠单纯的风格、行业暴露来挣钱。随着这些常规因子的“beta化”,免费或廉价午餐越来越少,赚这些因子的钱所须承担的风险越来越高。想要通过因子择时来获取超额收益,从过去来看就比较难,何况未来?这也印证了历史回顾中的观点:未来量化一定会是在传统风格行业之外的新赛道展开激烈比拼:一是基本面因子深度挖掘,二是如舆情之类的另类数据,三是进一步优化模型与提高算力。无论哪种方向,最终都将形成新的红海。

招证私募指数简介

招商证券私募基金指数(CMSFI)是托管部联合研究咨询部,基于私募基金长期历史数据,以科学性、客观性为原则,采用严格的统计建模技术标准与私募行业最佳实践经验研发、编制的一套中国私募基金指数体系,包含市场指数(CMSFI-Broad)及精选指数(CMSFI-Core)两个子系列。

如何获取指数:

1、成为招证托管外包客户,登录管理人平台,在 “投资服务” 中可点击获取指数月报,包含各指数净值、收益分布、市场动态,同时可查阅市场指数的日频率行情

2、定期关注招证托管外包公众号月度推出的《指数小课堂》栏目

3、其他问题与沟通,请直接联系招证托管金融工程团队。

免责声明

本文所载的信息、数据或分析模型均仅供参考,不构成招商证券对任何人的投资建议,或作为任何特定计划投资决策的依据。在任何情况下,招商证券不对任何人因使用本文中的任何内容所引致的任何损失负任何责任。“招商证券私募基金指数”及相关分析完全基于脱敏、授权数据编制、研发。