拨开迷雾,明汯解读量化投资之道 (二)

裘慧明   2018-01-30 本文章594阅读


作者:裘慧明


上一篇简单介绍了什么是量化投资、量化投资在股票市场上的运用以及和主观研究选股等其他几种选股方法论的区别。本篇会具体介绍量化选股是怎么做的以及市场中性产品的特点和挑战。


第六章 量化选股研究

基本面、价量和交易行为分析

量化选股并不神秘,只是结合了市场上一些有效的因素,比如价值投资、成长股投资、中期提供流动性以及交易者行为预测等等,然后通过科学的方法组合起来形成一个有效的个股预测方法


要能预测未来的个股收益,首先要对个股的收益有深刻的理解。从最早的CAPM模型开始,金融学界就对怎么解释股票的收益做各种尝试。CAPM模型放到股票市场上可以理解为股票的收益可以简单的分解为市场的收益和个股本身的收益,个股的风险也可以相应分解为市场风险和个股本身的风险


但这个简单的模型并不能很好的解释股票市场的一些现象,法玛和弗兰奇教授在二十世纪六十年代提出了Fama-French模型,把个股的风险和收益分解为市场的部分、大小盘风格的部分、高低市净率风格的部分以及剩下的个股风险。这个比简单的CAPM模型更好的解释了市场的一些行为,而且他们发现在过去的美国股票市场,小盘股平均跑赢大盘股,低市净率的股票平均跑赢高市净率的股票。法玛的学生DavidBooth以此发现为基础建立了著名的Dimensional Fund Advisors (简称为DFA基金),用的策略就是买低市净率的小盘股,最后到达了管理4000多亿美元的规模。当然随着这个策略的熟为人知,这个策略的有效性也在下降。在现在的主流量化界,大家一般认为小盘股风格和低市净率风格都是风险因子,而不是超额收益因子。因为从90年代以后,这两个风格的超额收益非常低,而且波动很大,所以主流的量化选股模型基本都会选择减小在这两个因子上的暴露。


随着研究的进步,量化研究人员挖掘了更多能解释个股风险的一些因子,形成了不同的风险模型,这些模型相对复杂,需要专业人员维护,所以一般都变成商业化的软件。比如Barra模型,APT模型,Axioma模型等。好的模型基本能解释个股30-50%的波动率风险,其他的风险可以归结为个股本身特殊的风险。为什么要做这个分解?因为绝大部分专业投资者的目标是做出超额收益,同时又减少风险如果我们对个股的收益风险有很好的理解,比如有一个比较好的风险模型并且清楚每个股票在不同风险因子上的暴露,我们就可以通过一个聪明的组合方式减少我们的股票组合在这些风险因子上的暴露,从而实现比粗暴的简单组合在同等风险下更高的预期收益,或者在同等预期收益下更低的风险。


有了风险模型这个工具以后,我们可以对个股做更深入的分析。一般来说,个股的风险可以分为四个来源,一是市场本身的风险,二是各种大小盘、价值、动量等风格的风险,第三是各种行业的风险,最后是个股自身的特殊风险。收益也可以同样分解为四个来源前一篇提到过,如果能预测市场本身的收益,这就是所谓的Beta择时。如果能预测各种风格和行业的收益,就是风格和行业择时。实践中证明这几类择时是非常困难的,在华尔街有句俗语:“如果能做好择时,全世界都是你的”。而且实际上也确实没有投资经理能靠择时保持长期的超额收益。


我们把股票收益中和市场、风格、行业等不太容易预测的部分剥离出去以后,剩下的就是个股特有的收益和风险。量化投资的实践下来,预测个股的特有收益要比股票的全部收益要容易一些,绝大部分的主流量化选股研究也集中在这个方向上面。


一般量化选股的研究人员会从几个维度来研究个股行为:第一个方面是基本面的研究,这主要是通过对公司的经营数据进行分析,结合市场价格做出这个股票在整体股票市场上相对价值的一个评估,也就说这个股票在整个市场是相对便宜还是高估的。量化投研人员会对公司的各种经营数据,比如净资产、市盈率、净资产收益率、现金流、库存、应收应付等一系列数据做分析处理,形成一些对个股未来价格有预测性的数据,也常称之为基本面因子。这个和主动投研的基本面研究是异曲同工的。就现在来说,量化投研比较擅长于对公开数据的研究,对新闻和突发事件的处理还有其他复杂信息的处理还落后于人脑,但这个也在慢慢的改变,人工智能和机器学习的发展在这方面最近有很大的突破,在部分文本分析领域计算机的理解能力已经证明能超越人脑。在不远的未来,计算机有望能在金融复杂信息处理方面超越人脑,从而更加推动量化投资领域的发展。这些进展我会在整个系列的第三部分做简单介绍。


从基本面研究角度来说,量化选股和主动投研的价值投资和成长股投资没有本质差异。市场上有一个常见的误解是量化选股就像个黑盒子,不知道为什么会选出一些股票来做多,其他一些股票来做空。实际上量化选股在海外股票市场几十年来能一直稳定的做出超额收益,我们公司在中国股票市场上的实践也是非常成功,这必然是抓住了市场的一些本质规律,而这些规律必定是和历史上成功的选股方式有共同点。比如基本面因子的选股,常见的一些因子会评估一个公司比起市场上的同类公司来说是不是估值更便宜,这个和普通意义上的价值投资很象。另外一些因子会评估一些公司是不是比同类公司成长性更好,这又很象成长股投资。当然除了这些指标以外,量化投研人员会抓取更多的有效指标来预测个股的涨跌,上面只是简单的几个例子。不同量化投资机构的投研人员会对公开数据做不同的处理,这也导致了每一家量化投资机构的业绩也不太相同。中国股票市场上另外一个常见的偏见是认为量化选股大同小异,每一家业绩也会大致接近,这个和事实偏离也非常大。就象市场上很多主动投研机构都在做价值投资,长期业绩也有非常大的差异,投资者不会因为一些机构的投资业绩不佳而否定价值投资。量化投研机构也是这样,长期业绩取决于量化团队的投研实力以及研究的主导人员是否对股票市场有深刻理解。由于国内量化市场刚起步,市场才刚刚开始优胜劣汰的筛选过程,也不能因为少数量化机构一段时间的业绩不佳而否定量化选股的有效性,况且从可同比的数据来看,近4,5年量化选股团队的平均收益是大幅超越主动投研团队的。


中国的公募基金限制较多,交易费用也比较高,所以公募的量化团队大都集中于基本面因子的选股研究。因为基本面因子变化相对没那么频繁,选出来的股票换手率也较低,比较适合公募机构。在这样的限制下,公募的量化团队整体来说依旧做出了不俗的业绩。笔者在2013年回国,当时开始跟踪了几家公募量化团队。到2017年底,每一家的量化选股多头产品的3年期业绩基本上都在股票型产品中排名前25%,而且和业绩基准的偏差更是大幅小于同类主动投研型股票产品。这也充分证明量化选股里面的基本面因子选股在中国股票是非常行之有效的,而且和其他长期投资的投资方式一样,在股票市场上赏优罚劣,选出好的公司和股票,对整个股票市场起到了非常正面的作用。


量化选股的第二个维度是价量因子的研究,就是纯粹用市场的交易数据,包括日级别和更细级别数据的研究来预测个股的涨跌,这个预测周期可短可长。如果预测几天股票的相对收益,一般来说称之为统计套利模型。如果预测日内或者更短时间股票的相对收益或者绝对收益,一般称之为日内模型。为什么能用交易数据来预测股票行为呢?本质上交易数据反映了短期的股票供需,而通过对供需的分析,有两种典型的行为发生,一种是趋势型的交易,发现更准确的市场平衡价格,另一种是反转型交易,倾向于给市场流动性需求者提供流动性,而获得一个合理的回报。平均来说价量的选股模型不管从交易量上还是盈利的总量上更偏向于后者。也即是从总体来说,价量的选股模型更多的是提供流动性。股票以及其他交易品种流动性提供者可以分为两个维度,一个维度是在非常短的周期上给市场交易者提供短期的流动性,这个功能一般由做市商的交易者来提供,大家也比较熟悉和认可。但往往在单边市场上,做市商者很快会耗尽他们的风险额度,额外的流动性那就通常由价量交易者来提供。价量交易者会提供一个比较中长期的流动性来满足流动性需要者。举个直观的例子,一个公募基金或者其他的长期投资机构需要调仓,可能需要调仓的总量比较大,所以做市商者是不能满足机构的需求的。这个时候价量交易者会提供更多的流动性,让长期投资机构顺利的在可控成本下完成调仓。价量交易者承担了短期的风险,提供了一个服务,长期来讲这个服务能获取一个合理的回报,这也是价量的选股模型能长期有效的一个主要原因。


量化选股的第三个维度是通过对市场交易者的行为分析,这方面又比较接近主观的行为金融交易者。这类交易主要通过对市场其他参与者的分析来获得一个超额收益。不管是一个股票的公司内部人员,还是覆盖这个股票的分析师,还是机构和个人投资者,都有各自的利益驱动。长期来说,这些市场参与者都会呈现一定的规律,而行为金融交易者希望通过这个规律实现盈利。从一个方面说中国股票市场上大部分的个人交易者都属于这类。不管在欧美等发达国家市场还是中国股票市场,监管层对这部分交易者在整个市场所起的作用一直有争议,因为有些交易行为很难界定为是正常的交易行为还是在操纵市场。在中国股票市场尤其争议比较大,由于中国特殊的交易结构,比如T+1的交易制度、涨跌停板制度,以及中国股票市场的散户参与度较高,造成有些交易者可以通过交易者行为获得极高的超额收益,比如历史上著名的涨停敢死队等等,现在中国股票市场很多次新股的交易还充分体现了这个特征。由于部分短线交易模式的合法性相对存疑,量化投资者一般会规避一些有嫌疑的交易行为。量化选股在这方面的研究注重于可以推导出其他交易者行为的一些公开数据,而不是通过交易影响市场。总体来说,在合法的框架下,行为金融交易者也是市场上非常重要的参与者,提供了市场的流动性,也对促进市场的有效性做出了贡献,丰富了市场的生态。


综上所述,量化选股是综合了股票市场上一些有效的因素,比如价值投资、成长股投资、中期提供流动性以及交易者行为预测等等,然后通过科学的方法组合起来形成一个有效的个股预测方法。


既然是基于历史的预测模型,有读者可能会问如果市场改变了,量化选股模型的有效性是不是会降低?这个问题实际不只是量化投研人员需要回答。其他的市场参与者,不管是价值投资者,成长股投资者还是其他交易者同样要回答这个问题。本质上人类的的大量认知和行为都是基于过去的经验能用到未来,大家也都清楚股票市场的特点就是充满了不确定性和未知性,所有交易者都希望在不确定的环境中寻找确定性,不管是主动调研的研究员还是量化研究员,无不如是。就拿主动投研里面安全边际比较高的价值投资来说,即使最优秀的价值投资者也会犯错。比如巴菲特投资可口可乐,很多价值投资从业者会把1988年巴菲特投资于可口可乐当成一个成功的范例。确实可口可乐从1988年到1999年市值翻了11倍,年均复合收益率27%,这段时间非常成功。但问题在于巴菲特继续持有了18年,在这后面的18年中,除了一些分红,可口可乐市值基本保持原地不动,收益甚低。他在美国航空的投资更是从头到尾没有什么盈利。但成功投资者的特点就是投资成功的案例数量要远超过失败的案例数量,也就是所谓的胜率高,长期积累下来就能获得一个非常优秀的超额收益。要做到高胜率,成功的主动调研投资者也是从股票市场的成功案例吸取经验,从失败案例中吸取教训。从这个角度来说,量化选股和主动投研选股并没有本质区别,大家都是从过去的规律中找寻逻辑的合理性和相关性,而尽量减少偶然因素的影响。而且由于量化选股模型平均来说持仓周期要小于主动投研选股,当市场发生变化时,量化选股模型对市场的适应速度往往会更快一些。当然要做到这一点,优秀的量化投研人员要能从变化的市场中找到比较稳定的规律,从而在各种市场环境中都做出超额收益。


预测错误怎么办?这个预测是有不确定性的:比如在月度级别上的预测,一个还不错的量化选股模型在中国股票市场有65%以上的准确率,长期来说这个模型一定能有不错的超额收益。但由于有35%的概率选的个股会跑输市场,如果选的股票个数过少,股票组合的波动就会比较大,而选的股票过多,则会稀释股票组合的超额收益。怎么解决这个问题?量化投研人员很早就有比较成熟的方案,一般通过优化器来解决。量化投研人员会把个股的预期收益,股票的特有波动,和个股之间的相关性等数据输入优化器,结合其他一些限制条件,然后基于不同的优化目标和最终组合的风险偏好,输出一个合适的股票组合。当然怎么组合也取决于产品类型。


第七章

是市场中性策略,不是阿尔法策略

市场上主流的量化股票产品一般大致可以分为两大类,量化股票多头或多空策略,和量化市场中性策略。


量化股票多头或者多空产品一般有比较大的市场风险暴露,股票组合的波动本来就会比较大,在这种情况下,对优化目标的限制相对比较宽松,一般会去追求一个较高的收益。而量化市场中性产品就更加复杂一些。在中国市场,量化市场中性产品常被称为阿尔法产品,这个名词其实非常不准确,在海外也没有这种叫法,一般这类产品在国际上被称为市场中性产品。本系列的前一篇提到过,不管是主动投研还是量化投研,都会追求个股的超额收益,也即阿尔法。如果希望对冲掉市场风险,主动投研机构也会发市场中性产品。但具体操作上,海外和国内也有所不同:在欧美等成熟市场,股票融资融券都极为方便,融资成本极为低廉(以美国市场来说,大机构的融资成本一般小于Libor(伦敦同业拆借利率)+0.3%年化利率。融券也相对容易,除了少数流动性不佳的股票以外,很多流动性好的股票融券成本在(0.3%-Libor)年化利率左右,流动性差的股票以及热门的做空股票取决于融券的难度再增加几个点成本。举一个直观的例子,一个做多一亿美元股票,做空一亿美元股票的组合一年的融资融券成本仅为60-80万美元左右),所以市场上绝大部分市场中性产品都是做多一篮子看好的股票,做空一篮子不看好的股票。如果预测准确,两边都能实现相对市场的盈利。当然事物经常有两面性,交易和融资融券的便利也使市场变得极度有效,使得不管主动投研机构还是量化投研机构获得超额收益 。而中国市场是个股融资成本较高,融券也不是非常便利,市场中性产品的普遍做法是做多看好的个股,做空股指期货来对冲。但由于中国市场只有上证50,沪深300,中证500三种股指期货,在股票组合的选取上就有很多的学问。


另一个笔者反对阿尔法产品叫法的原因是:这种叫法容易误导量化投研人员以为只要对冲掉市场的风险,就能获得一个比较安全的绝对收益,而事实上并非如此。本篇的前面提到,个股的风险除了包括市场风险以外,也包括大小盘等风格风险以及行业风险。大小盘风格的风险在2017年的中国股票市场显现的尤其明显,去年代表蓝筹的沪深300指数上涨21.78%,而代表小盘股的中证1000指数下跌17.35%。大小盘风格的风险比市场本身的风险还要大。除此之外,行业的暴露在特定的市场阶段也会有很大的风险。


中国的市场结构对量化市场中性产品的设计形成比较大的挑战,不但要考虑选出有超额收益的股票,也要考虑股票组合部分的大小盘风格和行业配置是否与对冲标的的大小盘风格和行业配置相匹配。如果不够匹配,在特定的市场环境下,市场中性产品就会有比较大的风险,从而导致市场中性产品偏离低回撤风险,中等收益的设计目标。在过去的2017年,大部分量化市场中性产品表现不佳,一部分是因为整年的股指贴水还是较大,另外一部分也是因为很多量化投研机构没有在市场中性产品里面去除干净风格因子的影响。


2018年是新的一年,随着整体股票市场的走高,市场情绪大幅改善,持续了很长时间的股指贴水也有较大变化。在笔者落笔的今天,沪深300和上证50股指期货全面升水,中证500股指期货的贴水也非常小,非常有利于市场中性产品建仓。我们有理由相信在现有的市场条件下,在2017年已经证明了自己投研实力的量化投研机构,将会在市场中性这个产品类别上为客户带来非常满意的收益。


第八章

量化机构要做大股票多头类产品

量化投资机构要吸取过去两年的教训:在国内环境多变的情况下,不要局限制于市场中性产品,更应该做大量化股票多头。


在现在股指限仓的环境下,沪深300股指和中证500股指的总持仓在7万手左右,即使空单全部由市场中性产品所持有,也就对冲800亿左右的股票规模,这个规模相对于股票产品而言还是非常小的。实际上,从过去三四年的实践来看,大部分量化私募产品的选股端都有不错的超额收益,如果改成股票多头产品,应该能获得不错的绝对收益。所以,量化私募不应该局限在量化市场中性这个产品类别里面,更应该让合格的机构和个人投资者更多的了解量化股票多头和量化股票多空私募产品。明汯在过去三年的实践中证明:只要持续能给客户带来绝对收益,不管是机构还是个人投资者对量化多头的认可度还是非常高的,量化公募的快速发展也证明了这一点。


当然比起知名的主动调研私募,量化私募的普遍缺点是成立时间较短,公开业绩不够长,市场知名度也不够大,大部分基金经理没在国内公募或者券商资管等有公开投资业绩的机构工作过,所以需要更长的时间得到机构和个人投资者的认可。其实这是大部分私募基金经理都要面临的问题,并非仅仅是量化私募机构。投资是个非常长期的过程,从短期业绩上来说,在任何时候都有比巴菲特业绩好的基金经理,但50几年的长期优秀业绩使得巴菲特成为投资传奇。有志于资产管理行业的量化投研人员应该潜下心来,加强研究,做好业绩。同时也不忘做好投资者教育,把好的理念,好的产品推广给更多的机构和个人投资者,实现和投资者的共赢。


量化基金在海外不管在共同基金还是对冲基金行业,都已经成为市场非常重要的组成部分。国内量化私募才刚起步,管理规模也还非常小,占整体私募管理规模的比例还非常低,但前景非常广阔。中国经济在改革开放的40年以来,经历了人类社会历史上少见的长期高速发展,中国的私人财富规模不断扩大,现在拥有上千万人民币可投资资产的高净值人群已经达到200万左右,而且还在快速增加。在未来的十年以及更长的时间,这些高净值客户会把更高比例的可投资资产配置到股票私募行业,所以不管是总体的私募规模还是量化私募的规模都会有大幅的提升。只要有足够长的业绩以及投资者更多的接受量化投资的理念,相对主动投研而言,收益风险比更高的量化投资机构更有机会得到机构以及高净值个人投资者的青睐。只要量化私募做好自己的业绩,积累足够长的投资记录,一定会得到机构和个人投资者的认可。未来必然会有一批优秀的量化私募能跻身于国内甚至国际一流的私募行列,管理规模几百亿甚至上千亿,为未来中国的财富管理事业做出重要的贡献,也为投资者带来丰厚的回报。


**本文由上海明汯投资管理有限公司团队原创,未经授权谢绝转载

**本报告介绍的信息、工具和资料仅供一般性参考。除非另有明确协议,并不构成广告或分销、销售要约,或招揽买入任何基金或其他投资产品的任何要约或要约邀请。

**投资涉及风险,投资标的的过往业绩并不预示或暗示其未来表现,投资者在做出投资决策前应认真阅读相关产品合同,可以寻求适当的专业投资和税务咨询意见。投资者不应该依赖本报告所提供的资料做出投资决策