量化交易平台挑战

其实量化交易平台挑战的问题并不复杂,但是又很多的朋友都不太了解量化交易平台的挑战都有哪些,因此呢,今天小编就来为大家分享量化交易平台挑战的一些知识,希望可以帮助到大家,下面我们一起来看看这个问题的分析吧!

本文目录

  1. 量化交易平台的挑战都有哪些
  2. 关于量化交易,这些入门知识你需要了解
  3. 在投行内部做量化交易与独立出去做量化交易有何不同

一、量化交易平台的挑战都有哪些

量化交易平台的功能一般包含三大块:研究、模拟、实盘。转化到技术层面为:数据、回测、实盘、安全等等。

基于国内市场,我们遇到的挑战如下:

数据包含两类,一类是行情数据,一类是财务、基本面、舆情、研报等其他数据。行情数据:

目前市面上分钟级的数据比较精准,可以用于中低频的交易回测;历史、实盘TICK级的Level-1、Level-2数据需要自己找渠道去获得,较容易找到的渠道很容易出现漏数据、不精确等情况,需要工程师专门结合了多家数据源进行核对修复。

回测最难的在于如何确定成交量,同时要考虑复权、停牌、ST*等问题,这里面有很多细节

安全在交易平台的开发中是重中之重,如何保证策略的安全性,不被外部、内部人员所窃取,分为2部分。

一部分是WEB安全,一部分是策略的编译安全。

因为量化交易平台是用户可编程的,我们京东量化选用的是PYTHON语言,因为有强大的科学计算库和高性能,导致用户可以调用很多系统级API,在这上面我们下了很大的功夫来保证用户的策略安全,做到理论级的策略隔离。

只能大概讲一下,这里面每一个部分都可以延伸出来成为一个话题。

二、关于量化交易,这些入门知识你需要了解

1、这篇文章将向你介绍量化交易系统的一些基本概念。本文主要面向两类读者,第一类是正在努力寻找一份量化交易员工作的求职者,第二类是期望尝试开启自己量化交易事业的个人投资者。关于量化交易,这些入门知识你需要了解。

2、量化交易是数量金融学一个极其艰深复杂的领域。若要通过面试或构造你自己的交易策略,就需要你投入时间学习一些必备知识。

3、量化交易系统包括四个主要部分:

4、策略识别:搜索策略、挖掘优势、确定交易频率。

5、回溯测试:获取数据、分析策略性能、剔除偏差。

6、交割系统:连接经纪商、使交易自动化、使交易成本最小化。

7、风险管理:最优资本配置、最优赌注或凯利准则、交易心理学。

8、我们首先来谈谈如何识别一个交易策略。

9、所有量化交易流程都肇始于一个初期研究。这个研究流程包括搜索一个策略、检验它是否适合你可能正在运作的策略组合、获取任何测试策略时所需数据、努力优化策略使其预期年化预期收益更高且(或)风险更低。如果你是一个“散户”交易员,一定要清楚自己的资金是否充足,以及交易成本对策略的影响。

10、通过各种公开数据搜索可盈利的策略实际上十分简单,并没有大家想的那么难。研究学者会定期发表理论交易结果(虽然大多为交易成本总额)。一些数量金融学主题博文也会详细讨论策略。交易期刊还会简报一下基金管理公司使用的一些策略。

11、你可能会问,个人与公司怎么可能愿谈他们的可盈利策略,特别是当他们知道,如果其他人“复制相同的策略”,长期而言它终将失效。

12、原因就在于,他们通常不会透露具体的参数以及他们所使用的调参方法,而这些优化技能才是把一个表现平庸的策略调成一个回报丰厚的策略所需的关键技术。实际上,若要创建你自己的、独一无二的策略,一个最好的法子就是寻找相似的方法,尔后执行你自己的优化程序。

13、你所看到的很多策略都可归入均值回归交易策略、趋势跟随或动量交易策略两类。

14、均值回归策略试图利用这么一个事实:“价格序列”(如两个关联资产的价差)存在一个长期均值,价格对均值的短期偏离终将回归。

15、动量交易策略则试图“搭上市场趋势的顺风车”,利用投资心理和大基金结构信息在一个方向积聚动量,跟随趋势直至回归。

16、定量交易还有一个重要方面,即交易策略的频率。低频交易(LowFrequencyTrading,LFT)通常指持有资产超过一个交易日的策略。相应地,高频交易(HighFrequencyTrading,HFT)通常指持有资产一个交易日的策略。

17、超高频交易(Ultra-HighFrequencyTrading,UHFT)指持有资产的时常达秒级与毫秒级的策略。虽然散户可以进行HFT与UHFT交易,但也只是在你掌握了交易“技术栈”与订单簿动力学的详细知识后才有可能。本篇入门文章,我们不会对这些问题做任何深入探讨。

18、策略或策略集合一旦确定,现在就需要在历史数据上测试其盈利能力,这就进入了回溯测试的工作范围。

19、回溯测试的目标是提供证据,佐以证明通过以上流程所确定的策略,无论是应用于历史(训练)数据还是测试数据均可盈利。它可以反映该策略未来在“真实世界”中的预期表现。

20、由于种种原因,回溯测试不能保证一定成功。这或许就是量化交易最为微妙之处,由于它包含了大量的偏差,我们必须尽尽力仔细审查并剔除它们。

21、我们将讨论几种常见类型的偏差,包括先窥偏差、幸存者偏差与优化偏差(亦称“数据窥视偏差”)。回溯测试中其他几个重要方面,包括历史数据的可用性与清洁度、真实交易成本及可靠回测平台上的决定。我们会在后续“交割系统”一节深入讨论交易成本。

22、策略一旦确定,我们就需要获取历史数据,并藉此展开测试,如有可能还可改进策略。现在卖数据的很多,所有资产类型的数据都有。通常,数据的质量、深度、时间间隔不同,其价格也不同。

23、刚入门的量化交易员(至少零售等级)最初使用雅虎金融板块(YahooFinance)的免费数据就行。对于数据供应商,这里不再赘言。我想重点谈一谈处理历史数据时,时常遇到的问题。

24、对于历史数据,人们主要关心的问题,包括数据精度或清洁度、幸存者偏差、应对如分发红利、拆分股票等公司行为的调整。

25、精度与数据整体质量有关,无论数据是否包含错误。有时错误容易识别,比如使用一个窄带滤波器,就可以找出时间序列数据中的“窄带”并更正它们。其他时候,错误又很难甄别,经常需要根据多个数据供应商提供的数据进行对比检查。

26、幸存者偏差通常是免费数据集或廉价数据集的一个”特征“。对于一个带有幸存者偏差的数据集,它不包含已经不再交易的资产数据。不再交易的证券,则表示已经退市或破产公司的股票。如果数据集中含有此类偏差,策略在此数据集上的测试表现可能比在”真实世界“里表现的更好,毕竟历史”赢家“已经被预先筛选出来,作为训练数据使用。

27、公司行为即公司开展的常引发原始价格阶梯形变化的”逻辑“活动,它不应该计入价格预期年化预期收益。公司分发红利和拆分股票行为是引发调整的两个常见行为,二者无论发生哪一种,都需要进行一个”回调“的流程。我们一定要留心,不要把股票拆分和真实预期年化预期收益调整混为一谈。许多交易员在处理公司行为时都碰过壁!

28、为了开展回溯测试,我们必须使用一个软件平台。你可以选择一个专门的回测软件如MultiCharts,一个数值平台如Excel或MATLAB,或者一个用Python或C++完全自主实现的平台。对于MultiCharts(或类似平台),个人是比较介绍,对于编程的要求比较低。

29、在做系统回测时,一定要量化表示系统性能。定量策略的“业界标准”度量为最大资金回挫与夏普比率。最大资金回挫表示一段时间(通常一年)内账户资金曲线从波峰至波谷的最大跌幅,常使用百分比表示。

30、由于大量的统计因素,LFT策略比HFT策略的资金回挫更高。历史回测会显示过去的最大资金回挫,它能够较为贴切地反映策略的未来资金回挫情况。第二个度量指标是夏普比率,它被启发式地定义为“超额预期年化预期收益均值与超额预期年化预期收益标准差的比值”。

31、这里,超额预期年化预期收益表示策略预期年化预期收益超出某个预定基准,如标普500或三月期短期国债(预期年化预期收益)的额度。注意人们通常不使用历史预期年化预期收益指标,因为它忽略了策略波动性的影响,而夏普比率却考虑到了这一点。

32、如果经过回测,策略的夏普比率很高且其最大资金回挫已经最小化,则可以认为它趋于无偏,下一步就是要搭建一个交割系统。

33、交割系统是一个方法集合,由它来控制交易策略生成的交易列表的发送和经纪商的交割行为。事实上,交易可以半自动、甚至全自动生成,而执行机制可以手动、半自动(即“点击一次交割一项”)或者全自动。

34、尽管如此,对于LFT策略,手动和半自动技术却比较常见;对于HFT策略,则必须创建一个全自动交割机制,由于策略和技术彼此依赖,还要经常与交易指令生成器紧密相接。

35、在搭建交割系统时,我们需要考虑几个关键因素:连接经纪商的接口、交易成本(包括佣金、滑动价差与价差)最小化、实时系统与回测时系统性能的差异。

36、联系经纪人的方法有很多,你可以直接电话联系他,也可以通过一个全自动高性能的应用程序接口(API)实现。理想情况,就是希望交割交易的自动化程度尽可能高。这样一来,你不仅可以脱开身集中精力进行深入研究,还能运行多个策略、甚至HFT策略(实际上,如果没有自动化交割,HFT根本不可能)。

37、前面说过的几种常用回溯测试软件如MATLAB、Excel和MultiCharts,对于LFT策略或简单策略都是不错的选择。但是,如果要做真正的HFT,你就必须要构造一个用高性能语言(如C++)编写的内部交割系统。

38、说个我的亲身经历,以前受聘于一家基金管理公司,我们有一个十分钟的“交易周期”,每隔十分钟下载一次新的市场数据,然后根据这十分钟的信息进行交割。这里用的是一个优化的Python脚本。对于任何处理分钟级或秒级频率数据的工作,我相信C/C++更理想。

39、在一家大型的基金管理公司,交割系统的优化通常不在量化交易员的工作范围。但是,在小点的公司或高频交易公司,交易员就是交割人,所以技术面越广越好。你要想进一家基金管理公司,一定要记住这一点。你的编程能力不说比你的统计学和计量经济学禀赋更重要,至少也同样重要!

40、另外一个属于交割系统的重要问题是交易成本最小化。一般地,交易成本由三部分构成:佣金(或税收)、损耗与价差。佣金是向经纪商、交易所和证券交易委员会(或类似政府监管机构)支付的费用;滑动价差是你的预期交割价位与真实交割价位的差值;价差则是待交易证券的卖出价与买入价之差。注意价差不是常数,它依赖于市场当前流动性(即买单和卖单数量)。

41、交易成本是决定一个策略是高夏普比率且盈利丰厚,还是低夏普比率且极不盈利的关键。根据回溯测试正确预测未来的交易成本很具有挑战性,你需要根据策略频率,及时获取带有卖出价与买入价信息的历史交易数据。

42、为此,大型基金管理公司量化交易的整个团队都专注于交割优化。当基金管理公司需要抛售大量交易时(原因五花八门),如果向市场“倾泻”大批股票,会迅速压低价格,可能都来不及以最优价格交割。

43、因此,纵使遭受损耗风险,基金管理公式也会选择使用算法交易,通过“打点滴”的方式向市场出单。此外,其他策略如若“捕到”这些必要性条件,也能利用市场失效(获利)。这是基金结构性套利的内容。

44、交割系统最后一个主要问题关系到策略的实时性能与回测性能的差异。这种差异由多种因素造成,比如我们在“回溯测试”一节已经深入讨论过的前窥偏差与最优化偏差。

45、然而,对于有些策略,在部署之前不易测得这些偏差。这种情况对于HFT最为常见。交割系统和交易策略本身均可能存在程序错误,回溯测试时没有显现却在实时交易时出来捣乱。市场可能受到继交易策略部署后的一场政变的影响,而新的监管环境、投资者情绪与宏观经济形势的变化也均可能导致现实市场表现与回溯测试表现的差异,从而造成策略盈利性上的分歧。

46、量化交易迷宫的最后一块是风险管理程序。风险包含我们之前谈论的所有偏差。它包括技术风险,比如所有在交易所的服务器突然发生硬盘故障。它还包括经纪风险,如经纪商破产(此说并非危言耸听,引发恐慌的明富环球就是一个例子)。

47、总而言之,它覆盖了几乎所有可能干扰到交易实现的因素,而其来源各不相同。已经有成套的书籍介绍量化交易策略的风险管理,本人也就不再对所有可能的风险来源做详细说明。

48、风险管理还包括投资组合理论的一个分支,即所谓的“最优资本配置”,涉及到如何将资本分配给一组策略、如何将资本分配给策略内不同交易的方法。这是一个复杂的领域,依赖于一些高级数学知识。

49、最优资本配置与投资策略杠杆通过一个名为凯利准则的业界标准建立联系。本文是一篇入门文章,我在此不详谈其计算。凯利准则对策略预期年化预期收益的统计性质做过一些假设,但是它们在金融市场中并不一定成立,交易员因此在实现时通常会有所保留。

50、风险管理的另外一个关键成分涉及到交易员自身心理因素的处理。尽管大家都承认,算法交易若无人为干涉,不太容易出现问题。交易员在交易时,稍不留神仍然可能会掺入许多认知偏差。

51、一个常见的偏差是厌恶规避,当人发现损失已成定局,其所带来的痛苦,可能会麻痹人的行为,不能做到及时抛盘止损。类似地,由于太过忧心已经到手的预期年化预期收益可能赔掉,人们可能也会过早抛盘收利。

52、另外一个常见的偏差是所谓的偏好偏差:交易员太看重事件而非长远地看问题。此外,当然不能落下“恐惧与贪婪”这对经典的情绪偏差。这两种偏差常导致杠杆不足或杠杆过度,造成爆仓(账户资产净值近乎为零或更糟)或盈利缩水的局面。

53、由此观之,量化交易是数量金融学中一个虽趣味十足但极其复杂的领域。我对这个话题的讨论浅尝辄止,文章就已经这么长了!我在文中三言两句带过的问题,已经有大量的相关书籍和论文出版。

54、因此,在你申请量化基金交易职位前,务必要进行大量的基础调研,至少应当具有统计学和计量经济学的广泛背景,以及使用MultiCharts、MATLAB、Python或者R程序语言实现的丰富经验。如果应对的是更加复杂的高频端策略,你的技能组合可能还要包含Linux内核修改、C/C++、汇编编程和网络延迟优化。

三、在投行内部做量化交易与独立出去做量化交易有何不同

这里我们只说量化交易,不讨论量化研究和量化定价这一块的业务。

量化交易是分两个阶段的。第一个阶段是2008年以前,或者说Dodd-Frank法案以前,投行内部林立着各样的很多对冲基金或者类对冲基金的实体,比如Morgan Stanley的PDT(Process Driven Trading)和高盛的Global Alpha,而很多投资银行的自营交易业务也很像对冲基金。在这一阶段,这些类对冲基金的实体和外面的对冲基金是没有啥区别的,业务很类似——赌方向、做部分对冲(Partial Hedging)、跨市场套利,也非常敢于承担风险。

当时在投行内做对冲基金类型的量化交易有着非常大的优势,因为两点——第一是银行有着非常良好的融资渠道,融资成本显著地低于当时的对冲基金,如果你尝试去组建过一个基金,你就知道资金成本对于一个对冲基金的影响多么大——巴菲特这么多年的成功是离不开长期1.6倍的财务杠杆和其低于中央银行存款准备金率的资金渠道的(详细内容参见AQR的论文——Buffet's Alpha)。炒股需要经常总结,积累,时间长了就什么都会了。为了提升自身炒股经验,新手前期可以私募风云网那个直播平台去学习一下股票知识、操作技巧,对在今后股市中的赢利有一定的帮助。

第二是银行有着一个灰色的信息流——客户的交易记录。这个交易信息,就是今天,也是非常有用的内部消息。几周前Bill Gross从PIMCO离开时,所有投行的Sales都疯了,不停地研究之前PIMCO在自己银行的仓位,然后分析那些债券最有可能最先被清盘,从而给其它客户交易建议。而当年文艺复兴多次更迭合作的投行,就是因为其大奖章基金的交易记录得不到妥善的保密,很多合作银行的自营交易桌跟着交易。

这两个优势造成了当时的自营交易极其暴利,而且管理层为了做大业绩,全力支持明星交易员放大杠杆——而实际上,金融危机期间很多的CEO都是靠着自营交易的暴利业绩从交易大厅升职到管理层的——比如Citi的前任CEO Pandit和摩根斯坦利的前任John Mack。

这也造成了,为什么很多高盛离职的自营交易员在金融危机后,当银行不能做自营交易后出来自立门户开设对冲基金,却完全无法复制当年的业绩——因为他们是因为整个组织的强大而获得超额收益,当失去了资金优势和信息优势后,一切都成为了浮云。

2008年,准确说是2009年后,一切都变了。

首先是政府明令规定自营交易不让干了,于是各种投行旗下的基金,放入资管部的放入资管部(比如Goldman Sachs Global Alpha进入GSAM),独立营业的独立营业(比如PDT从摩根斯坦利分离),要不直接就关门大吉了(比如UBS、德银)。

还有一些硕果仅存的,一般是在股票交易部门,打着对冲为名,通过会计手法,维持着极小的自营规模,这种类似的团队很多投行都有。但是不成气候了,也不会造成任何系统性的风险——当然,各种马路传奇故事也销声匿迹了。

银行内部还有没有量化交易了,其实还有——那就是随着计算机技术进步的自动化做市交易。做市在国内这个概念刚刚出现——因为期权做市商制度的引入。但是在美国这个是从华尔街开始就有的交易体系了。简单来说,就是假设你经营一家买可乐的小店,你有两个主要的交易——一是从总经销商那里拿货,用的价格是Bid,二是分销给街边下象棋和夕阳下奔跑的孩子们,这是Ask。Bid是你的进价,Ask是你的出货价格,Bid一般小于Ask(除非你是搞慈善的)。你持续的维持报出这两个价格,同时根据你的存货来调整报价或者对应报价的数量——比如你的存货太多,大爷不出来下象棋了,你就降低Bid,这样很难进到货了,而保持Ask,等待有人来消耗你的库存。

这个过程就是基本的做市商交易流程,在金融中,由于没有实际的总经销商供货,你的报价(Bid-Ask)是基于你对于对应资产的Fair Price的估计来决定的,通常是你算出来的均衡价格加减一个值构造成Bid-Ask组合。在很长的时间内,这个报价都是靠人来完成,这个过程是枯燥的,而且很容易出错——而对于期权类产品(非线性价格)也很难快速报价。我之前和期权交易员合作过很长时间,他们的工作不一定智力上很难,但是对于人得耐力绝对是一种挑战——因为在开市后他们要注意力高度集中的报价,一quote两quote,一quote两quote,似爪牙,似魔鬼的步伐,报价,报价,在这交易大厅报价......

于是,从简单的资产起,从交易所级别开始支持API交易了。什么是简单的资产,就是Vanilla类别的,比如个股、指数、外汇、国债等等。因此投行由于本来就是大量资产的做市商,开始把原来这套过程通过计算机来完成。后面大家发现计算机是完美胜任这项工作的,因为计算机能够高速计算库存来调整报价,还能报出很多复杂的单类型。因此从2000年开始个股、指数开始逐步被自动化做市来包揽,2005年后个股期权自动化做市大热,而2008年后外汇自动化做市也相当成熟了,2010年开始国债自动化做市也在美国兴起——这也是我目前在工作的内容。

那么对冲基金呢,除了传统的量化Alpha,他们难道不能也做这个业务吗?实际上,很多对冲基金的自动化做市业务比投行还要好——比如Citadel,比如KCG。但是区别何在?区别在于两点,第一是很多对冲基金不是专属做市商(Designated market maker)。DMM的特权是其有专属席位——在美国这样高度商业化的国家,DMM也是非常稀有的。原因在于,DMM是有责任的,那就是在各种大型金融危机中,当流动性极差的时候,DMM还是要持续的报价,一quote两quote,一quote两quote,似爪牙,似魔鬼的步伐......在流动很差的时候这是非常危险的,因为大家丢给你的都是不好的资产,比如大跌的时候,都在卖,你的Bid反复被Hit,然后又没人来hit你的Ask,浮动亏损可以非常大。那么DMM的特权呢,DMM可以获得非常高比例的rebate,也就是说,佣金返点非常高。这是对于其承担的义务的回报。

第二就是绝大多是对冲基金不是Broker,也是你一般想买股票不会去找他们报价。在外汇和债券这类市场中,有两级市场,一个是B2C市场,也就是零售市场,里面基本都是Broker-Client,而第二级就是B2B市场,都是Broker-Broker。一般来说,B2B市场的Bid Ask Spread要低一些。一个形象的例子就是,我小时候去批发书的商店买书,一个商店有本习题集没有,于是老板去隔壁家拿了一本,卖给我,最后肯定这个老板要把一部分价格还给隔壁家,我付的价格和老板付给隔壁家的价格就是B2C到B2B市场的差价。

这里投行又耍流氓了,他们有着B2C市场的接入优势,因此只要客户量够大,基本都能把自动化做市实现盈利——因为根据大数法则,一定时间内,买卖双方的交易量应该是均衡的。

那么对冲基金靠什么——靠更好的策略。对冲基金如果要做高频做市的,基本在B2B市场参与,他们不是DMM,但是也自己去报价,然后靠着对于价格走向的准确判断,来调整报价,实现拿到多数对自己有利的单,或者持有更久符合预测方向的单,来达到盈利。这种不是DMM却自发去做做市商的行为,叫做Open Market Making。

Citadel是期权自动化做市的王者,顶峰时期一年的利润可以到1 Billion(2009),而整个市场那年的利润也就是7 Billion左右。因此如果策略逆天,没有客户流,也能靠做市赚钱的。

此外,做市业务之外,对冲基金还多了很多机会。因为很多业务银行做起来不划算——比如商品。考虑一个金融类公司,不能光讨论交易策略,宏观上你一定要思考资金成本等问题,这才是投资之道在投资之外。商品这些之前银行干了很多坏事的业务(详细参加高盛的铜交易和JP的风电交易)都被监管方克以了极高的资本罚金。这是Basel III里面的规定,也就是你拿着1元的股票和1元的监管资产过夜受到的处罚是完全不同的,具体算法参见Basel对于RWA(Risk Weighted Asset)计算的细则。这一系列监管,造成了对冲基金有了大量的新业务——因为投行退出。而大量银行的人才也流向了对冲基金。

现在门径这么清晰,那么投行和对冲基金做量化交易的工作差别就很明显了——投行主要以自动化做市为中心的高频信号、客户流分析、报价博弈论等研究为主。而对冲基金主要是传统的量化Alpha、量化资产配置为主——当然还有公开市场自动化做市了。

希望可以帮助到你,祝投资愉快!

OK,本文到此结束,希望对大家有所帮助。

声明:本文内容来自互联网不代表本站观点,转载请注明出处:https://www.41639.com/15_497378.html

相关推荐