顶级量化交易员揭秘:从数学模型分析2020美国总统大选
—— 本文摘自《FTX 10月报》,由币圈头部量化机构Alameda Research交易员Sam Trabucco撰写。
几个月前,FTX上线了特朗普和所有民主党候选人的总统选举预测类合约产品——并最终缩小到只有特朗普和拜登。特别是TRUMP 2020的合约后来广受欢迎,为玩家们提供了一个非常酷的交易机会。
我花了很多时间专注研究交易该合约(以及其他合约)的策略,尤其是在选举开始之前,以及整个艰难而漫长且异常动荡的选举过程中。这个交易环境非常引人入胜,我很享受在这里进行交易的整个过程——更重要的是,我学到了很多东西。
将选举作为交易标的这一玩法早在2020年11月3日之前就开始了——在某种程度上甚至可以追溯到2016年。2016年的美国总统大选向世界灌输了有关投票民意调查错误的教训——全国各地都存在重大的投票民调错误。这导致特朗普击败希拉里·克林顿的选举结果出来后,公众预期被推翻,引起了较大的社会震荡。
没有一家主要新闻媒体预料到这一结果——就在选举前一天甚至还有些媒体预言希拉里的胜选几率为99%(预测稍微准点的机构如538预测网站,给出的数据也是接近30%)——这让人们对最终选举结果大感意外。
那么进入2020年,关于民调有多正确的某些观念就必须要改变了。Alameda关于所有这一切的基线假设是,民调误差的分布范围要非常广——本质上而言,在模型中代表民调结果的随机变量应该有着更高的标准差。这也就意味着选举结果充满了更大的不确定性——但这也不无道理,因为显然选举结果的变数,早就超越了2016年以前人们的预期。至于该为民调结果的分布给予多大空间,尚待商讨——但诸多因素都确实带来了很大不确定性,因此从某种程度上来说,必须得这样做。
这些导致不确定增大的因素包括:民调参与人给出的回答并不如我们想象中那么靠谱,可能出现的影响选举走向的重磅“十月惊喜”事件(例如在大选前一周爆出的“邮件门”事件,重挫了希拉里胜选的几率),另外,特朗普本身多变的人设就决定了他会比通常意义上的典型竞选人更具戏剧性和不确定性。
Nate Silver创建的538预测网站,因准确预测了2008年和2012年大选而闻名,声称也遵循了同一信条(为选举结果的随机性预留较大空间)。在2016年的选举预测中,该网站也比其他大多数同类预测要更精准——他们预测特朗普的胜选概率为30%。这是非常重要的,最终的结果实质上也只和538预测的结果相差一个标准差——尤其是对比其他同类预测的结果,538网站的这一预测可以算是非常不错了!
Silver表示,他的主要观点就是2020年大选总体上应该波动性会更大。但是,根据该网站今年的模型预测,特朗普胜选的机会只有10%。诚然,民意调查结果确实是对特朗普不太友好,反对特朗普的民调平均比2016年增长了3%左右。
但是Alameda认为,波动性应该已经增加了3倍左右——那么这就应该使得结果的波动性更大,实际上基本就接近了抛硬币时50%-50%的概率。当然,我们无法确定自己的判断就是对的!结果也证明不了什么。但这些结果确实表明,不确定性可能比538预测网站预测的要高得多。
另一种观点则来自相关的预测市场,例如FTX上的预测市场。它们比538预测网站给出的大选预测值要高得多——通常在选举前几周,它们的预测值约为30%。这确实意味着比2016年的波动性大得多——但不得不再次承认,这看起来似乎是合理的。
Alameda预测的波动性肯定高于538预测网站,但通常会稍低于预测市场的波动性,但并不一定低很多。而且,它也并非是恒定不变的。当大选临近且没有任何突发的异常事件时,我们的波动性就降低了——因为大选前没有“十月惊喜”事件爆出,就意味着最终投票结果很可能会跟民调结果差不多。而且,如果我们认为市场对价格不敏感的话,我们有理由维持波动性的高水平
因此,实话实说,以上就是我们在只有极少信息时,对大选前的(相关合约产品)交易的想法。选举日开始这些信息才会真正变得有指导意义。
我这么说是什么意思呢?
如上所述,现代民意调查的有效性有限。即使在摇摆州也是如此,那些州的各个团体确实有相当好的动机来尽力获取他们想要的好结果(尽管目前尚不清楚这些动机(尤其是金钱方面的动机)实际上有多强大,也许正是这点导致了民意调查会有如此大误差)。但是非摇摆州基本上又太不会费心去做民意调查。比如在538预测网站在佛蒙特州做的民调。
只有Survey Monkey这唯一一个调查组在佛蒙特州做了民调!其他非摇摆州情况也基本差不多。当然想想这也不难理解——有谁会有动力去做这些民调呢?大家都知道佛蒙特州会支持拜登,既然知道后,大多数人也不想再去关心,也不愿意再去了解更多其他信息。这也可以解释为什么我们在选举前得不到什么特别有用的信息。
虽然选举日当天,我们开始得到投票后的民调数据——说实话,这些信息也没什么指导性——但随后实际投票结果就开始出炉了,这些信息就非常有用了。各县开始发布结果时,它们显然可以帮助我们了解该县及其州的投票倾向——但是,如果你知道如何以行家的视角来看的话,这些信息实际上可以向我们透露更多内幕。
某些类型的选民投票倾向有着相关性。说实话,这也是意料之中的——新闻中我们都经常会听到人们谈论沿海选民,西班牙裔选民,城市选民或受过教育的选民倾向于投哪一方的票。选民群体有多种划分方式,,而即便按不同划分方式归类以后,多种划分方式仍旧暗示着这批选民倾向于投给某一参选者。例如大家可以看看,这张按教育水平划分的美国地图与2020年选举地图有何相似之处?
确定如何界定投票选民是否具有相似性的一系列标准后,我们就可以开始使用已有的投票结果来预测还没得到最终结果的各地的投票情况——这一工具非常强大。从理论上讲,这一预测过程可以在第一批投票开始时就开始——例如,从佛蒙特州开始,这种非摇摆州虽然对于民意预测专家来说并不重要,但对于想通过最早期投票情况预测后期投票结果来说的人来说,至关重要。
Alameda实时大选模型的主要工作原理就在于此——首先是利用已获取的选举数据预测不同地区的投票情况,然后各个地区实际投票结果出来后实时更新我们的预测。
当然,这种预测也没有什么明确的最佳方法,但是我们发现在我们构建模型时所做的选择都还算明智,我们(经常)能比其他机构更准确地预测事物走向,也证实了这一点。(顺便说一句,查找和提取更精准预测所需的所有数据并非易事——每个州投票选举的方式都不同,而且还总是会时不时出点小差错)。
当然,每次选举都有所不同,今年这次当然也不例外。这次与往年很大的一个不同之处是由于新冠肺炎疫情,很多选民很早就投票了。这些选票就导致早期结果特别偏向民主党——我们知道会有这样的倾向,因为特朗普不赞成他的支持者这么早投票,而且我们也有一些州的早期选民提供的大量党派登记数据。但我们不知道结果什么时候才会被制成表格并发布——这就导致了双方得票数差距悬殊。
事实证明,从时间线来看基本情况如下:发布的第一批选票中有很多是早期票,因此看起来拜登所获票数非常多。然后基本上所有的实时投票都出来了,特朗普又一举领先。最后,之前尚未统计的早期投票也一并计票并公布(。如果你不了解还有很多早期投票结果尚未公布,那你可能会认为特朗普会大获全胜——他的得票数基本上大大超越了所有的预测,而且如果这些投票确实非常具有代表性,他肯定会赢得此次大选。很多人都这么认为。
此时FTX上的预测市场(特朗普的胜率)也相应地飙升到了80%区间——人们只是看到了已经公布的投票结果,却没有考虑到还有哪部分结果尚未公布。这也可以理解!因为大多数州的报告都乏善可陈,根本没有说清楚。但是,如果你知道可能存在这种情况,则可以预测这种情况可能会发生——那么此时做空的话就是一个非常恰当的选择了。
顺便说一句,在此期间,直接交易TRUMP和BIDEN合约并不是唯一的好交易选择。例如,SPY(标普500 ETF-SPDR)与BIDEN有着很强的正相关性——很容易预测SPY会随之涨跌,因为显然美国市场会受到大选结果的影响,而且会产生何种影响也会很快明了。
由于 BTC 与SPY有一定的相关性,所以这也很大程度上解释了为什么BTC上涨这么多。如果你对交易产品熟悉的话,还可以在其他产品中找到与TRUMP合约联系紧密的交易,如果你知道如何在适当的时机卖出TRUMP合约,应该能挣到不少。
在撰写本文时,大选可能会结束,因为宾夕法尼亚州基本上已经出结果了。虽然还没人肯定地给出结论,但考虑到支持拜登的各地还剩的选票数,特朗普基本上已经没什么胜算了。顺便说一句,这个结果差不多在一整天前就可以预测到了——但是全世界大多数人都没有意识到这一点,因为当天公布的票数太少。
但是这些选票绝大多数来自费城这类地区,因此基本上90%的选票都会投给拜登,所以特朗普的失败几乎早已成了定局——这意味着,当TRUMP合约还继续在10%左右交易的时候,应该自信地做空此合约。 (但请注意,这也并非100%确定,因为可能会存在计票错误——但市场目前的走向应该是如此。)
至此,大选终于接近落幕了(除了特朗普可能会对结果提出抗议,但这应该不会影响到FTX TRUMP 2020合约)——我也很开心终于能睡个安稳觉了!这几天确实有点疯狂,充满了各种很酷的待解决问题,并且对于那些能够解决这些问题的人来说,这真是一个绝佳的交易机会。这样的交易环境很有意思,对于该如何在特殊情况下评估和采取行动,我们也学到了很多。我期待将来能将其应用于更多的交易场景!
阅读原文:
https://blog.ftx.com/monthly-digest/ftx-october-digest.pdf