热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

量化投资进化论

新浪财经讯金麟2017第四届量化投资与对冲基金年会3月25日在中国人民大学举办。国金基金量化投资总监林建武作了主题演讲《量化投资进化论》,他表示量化投资未来主要有三个

  新浪财经讯 金麟2017第四届量化投资与对冲基金年会3月25日在中国人民大学举办。国金基金量化投资总监林建武作了主题演讲《量化投资进化论》,他表示量化投资未来主要有三个趋势:第一,量化投资的全球化的方向;第二,量化投资的智能化的方向;第三,量化投资的机构化方向。

  以下为演讲实录:

  林建武:非常感谢丁总,感谢李教授邀请我来参加这个会,我是清华大学毕业的,回到人大的校园也很亲切,因为我曾经还有一个身份,是北京市小作家协会的主席,我们的总部在人大附中。

  我在华尔街做了十几年,后来回到国内教书,然后又回到业界来做,其实遇到很多的朋友、学生都问,说林教授,中国的量化投资到底发展到什么程度了?我们学生学了以后,将来有没有就业的机会,是不是可以赚到钱?很多人都在问这个问题,所以我这次来到校园跟大家简单分享一下我自己做这么多年的经历,和我对于整个中国量化投资发展的一个想法,跟大家分享一下。

  说到量化投资,我们肯定要看一下量化投资的趋势,我讲三个方向。第一,量化投资的全球化的方向;第二,量化投资的智能化的方向;第三,量化投资的机构化方向。

  先讲一下量化投资的全球化,大家看一下这幅图,讲的是全球量化投资对冲基金发展的历程。大家知道最早的对冲基金是1949年建立的,当时起家的时候只有10万美金,以200亿美金管理资产作为一个分界线的话,美国大概花了四五十年的时间达到这样一个规模;欧洲是2002年左右达到200亿美金,用了三四十年。

  亚洲,不包括中国,达到200亿美金是2006年,用的时间是二十年左右。首先我说中国,我觉得中国发展的进程肯定会比欧美快,像我们这样的从国外回来的非常多的人,会带来国外原来发展的技术跟大家分享,很多人也到国外去学习这方面的技术,它的发展进程是越来越快的。

  这个发展的进程对于每一个国家,它有什么样的影响呢?当然有很多好的一些影响,流动性的影响、各种各样的影响。但是我要跟大家分享的一点,其实很多做量化对冲的人可能都会意识到,也就是量化对冲对于整个市场的影响。

  美国有一个著名的指数公司,就是摩根斯坦利的MICI,现在分化出去了,它做的是全球各个不同国家的指数和全球的MICI指数之间的相关性,大家可以看到2007年之前这个相关性各有千秋,有的高、有的低,是一个非常广泛的分布曲线。但是到了2007年以后,经过次贷危机之后,也是量化投资不断发展之后,大家发现很多国家的股票指数和全球股票指数呈现了大规模的相关性。大家可以看到,整个的相关性在不断地变高。

  那么我们做量化对冲的都知道,量化对冲最核心的多空策略,选好的股票、做空差的股票,如果所有的股票同涨同跌我们怎么办?利润会下降。所以相关性来自于量化对冲,同时它使量化对冲的利润在发展。所以全球量化对冲的发展也带来一个非常重要的影响,使得我们市场上很多资产的相关性在变得越来越相关。

  我们看一下全球整个的发展,在欧美国家,美国、欧洲整个市场的相关性已经达到了50%、60%,甚至有的时候达到70%,这每个尖都代表着一次灾难,比如说希腊的国债危机、雷曼兄弟倒闭,当市场有大规模的市场性的信息的时候,就会造成市场上有更多的股票同涨同跌。比如说日本突然发生地震的时候,大家不再关心公司在日本到底在做什么,而是整个市场的相关。

  亚洲的相关性还是比较低的,整体的相关性在百分之三四十,所以在近些年有越来越多的对冲基金进军到亚洲,为什么?这是一个量化投资的天堂,它的相关性是比较低的。

  我们看一下,我这里做了一个很简单的图,画的是从2010年到2016年整个中国市场的一个市场相关性的发展,其实就是把两两的股票做一个相关性,做一个均值。大家可以看到,中国的市场整个的相关性也在不断升高,从大概10%到20%,一直升到50%、60%。上面画的一条是市场上所有的可以得到公开数据的α策略的均值,整个α策略总体的收益在相关性比较低的时候还是比较值的,当相关性升到一定程度的时候,越来越多的回撤发生了。所以各种各样的回撤从数学的角度来说,正是相关性影响的一个非常重要的原因。

  所以它告诉我们一件什么事情,其实我们在中国做量化投资,我们需要更多的多样性,其实多样性正在悄悄地在我们整个资产的配置中越来越重要,因为我们需要更多的另类资产来进行投资,不然的话你就会陷入一个相关性的误区。

  我们需要越来越多的策略,我们就必须要有更多的研究员去进行数据的分析和挖掘,对于数据分析这一块提出了更高的要求;它也使我们进入到整个应用人工智能和其他的一些领域,来促进我们量化投资,不仅是投资的自动化,而是投资策略的自动化和智能化。

  我这里把量化投资分成几个部分,量化投资可以把它抽象成三个部分的环节,第一个部分是我们有很多的金融的时间序列,也就是我们的金融数据。第二个部分我们叫做自适应的交易算法;第三个部分是很多程度我们还要依靠人,就是我们人的策略师,大家要不断地从这些策略里挑出好的策略。

  我们看一下人工智能会对于这三个方面情况做什么样的促进呢?第一块,我们知道其实我们还有很多的信息是非结构化式数据,不管是文本的、图像的、声音的还有其他的数据,是没有办法变成现在数据模型可以直接处理的数据的这种结构化数据,所以我们要利用人工智能的方法把它处理成结构化数据来进行交易。

  第二块是我们人工智能的算法,其实人工智能的算法大家说了很多,我总结一句,从我们数学的角度上来说,很多的人工智能算法就是非线性建模,它其实就是告诉我们,我们在我们遇到的数据里头,它的非线性成分越来越多,线性的东西被交易之后,逐渐地出现一些非线性的现象,我们需要很多的人工智能算法进行学习和总结。

  第三个部分,其实也是现在人工智能正在逐渐发展的一个难的领域,很多人都在尝试,我们叫做元知识学习,就是说我们原来去选一个策略去投资不同的资产,元知识学习是让我们怎么样来用机器选择不同的投资策略。其实大家可以看到,元知识学习逐渐开始使我们的人工智能有了产生知识的可能性,原来只是运用知识自动化地处理数据,而元知识学习是人工智能的一个高的层次。

  下面我们就这三个方面分别跟大家简单介绍一下,现在人工智能在量化投资的一个发展方向。

第一个方向是非结构化数据,我们讲一个简单的例子,2013年的4月23日,当时美联社发了一个推特的文章,说两颗炸弹在白宫爆炸,奥巴马总统被炸伤了。我们可以看一下,当时在一分钟之内标准普尔发生了什么事情,在一分钟之内暴跌了1%,按照美国当时的标准普尔的市值,其实在一分钟之内瞬间蒸发了1360亿美金,当然很快证明是一个假的推文,又回来了。说明什么?这是人工交易员交易的吗?不大可能,美国有大量的对冲基金使用推特上的数据进行自动化的交易。所以大家可以看到,新闻的非结构化自动交易在美国很多的高频交易公司已经广泛地使用。

  第二幅图是我美国加州的一个朋友给了一幅图,很有意思,跟大家分享一下。这幅图是美国一家公司,叫做RS Metrics,是一家军用的卫星公司,后来转了民用,这幅图是卫星航拍的俯视图,这是一家沃尔玛,这是一个停车场。大家可以想象停车场停车的数量跟人流量有关,人流量跟超市的销售量有关,销售量跟超市的利润有关。如果你可以把沃尔玛所有的停车场的数目和以前的停车场的数目进行对比,你可以算出沃尔玛这个季度的销售量是增量还是减量。算的以后,沃尔玛公司是一个上市公司,我们可以用这个方法在沃尔玛发季报之前,猜出来它发出来的季报是超预期还是低于预期,我们可以赚钱。

  所以大家可以看到,新闻可以做,图像也可以做量化投资。所以人工智能这种图像识别、文字识别,甚至语音识别,正在悄悄地走入量化投资,帮助我们扩展量化投资非常重要的食粮,也就是它的数据源。

  我们再讲第二块,人工智能的算法。我们先看一下整个金融学的发展规律,以前很长的时间里头我们根本就没有金融学,金融学一直到了17世纪、18世纪,才和经济学逐渐并存;到了19世纪、20世纪,才出现了大量的各种各样的金融学理论,所以我们正在从市场的定性分析变成定量分析。

  但是难道我们人是变得越来越聪明了吗?并不是这样。其实大家可以看到,有一件事情正在悄悄地影响我们整个的市场,也就是随着整个人类社会的不断发展,我们在积累不断的数据,只有有了大量的数据,我们从逐渐从定性分析发展到定量分析。

  同样,我们看一下整个人类投资的金字塔,人类投资最早的时候使用的是Buy-To-Hold,就是买了一支股票不动,持股20年。然后是Fundamental,其实正是市场上的数据越来越多,造成了我们进行越来越多的数据分析,我们有了交易所、行情,进行日的数据、分钟级的数据、毫秒级的数据,其实随着数据越来越多,来的频率越来越快,所以才产生了更多的量化投资,从量化投资统计套利、高频到做市,整个量化投资模型的发展,整个处理方式的发展,其实和整个这个社会金融数据的膨胀发展,不管是从数量还是频率,都是息息相关的。

  跟大家做一个简单的演示,演示一下我们数据建模的一种方法。假设我们看到这幅图,大家觉得这是什么东西?唯一的方法我们怎么做?做个线性建模,颜色深的分成一块,颜色浅的分成一块,我们好像看见了三个东西,慢慢可以把它圈出来,然后开始非线性建模,现在就看出来了,是企鹅。正是随着我们得到的数据越来越多,我们的模型从线性逐渐变成非线性,从简单的模型到复杂的模型。

  其实量化投资也是同样的情况,量化投资借助着我们前面越来越多的人工智能处理更多的数据,也正在从完全的线性的人工建模进入到非线性的建模。最早的时候量化投资很多人去读各种各样的技术分析,其实它都是非常简单的建模,而是都是靠交易员长期观察市场来得到的,它的这些指标里头、评价的一些标准,最后整个数据的结构,全部都是人来进行建立。

  随着我们有了更多的指标,很多人在用遗传算法,把好的留下来,差的去掉。所以慢慢指标这一块可以开始通过计算机来选择,但是后面的数据结构还需要人来定。

  我们将来有一天如果这个机器真能把神经元网络也自己猜出来,我估计咱们人类历史就有可能结束了。但是这个东西到底能不能来到这一天我也不知道,但是通过这个东西大家可以看到,我们整个的量化投资正在越来越地使用机器替代原来人做的这个东西。

  我们可以看一下,最后我们讲一下元知识学习。元知识学习我不讲太多,我们刚才讲了量化投资其实是一个非线性建模,同时人工智能用一句话说就是一个优化算法,就是一个非线性优化算法,你想要实现人工智能,最主要的是一个计算能力。

  给大家举一个简单的例子,我们假设我们有100个策略,每个策略有1000个测试题,每个策略同时又四个参数,每个参数都是从1取到10,那么要有10000个参数,每次仿真需要100秒的时间,这样一个简单的选取就是要花1的11次方秒,相当于3000年。这个太傻了,我们需要并行计算,如果我们需要100个CPU进行并行计算,还是需要30年;如果我们用遗传算法可以提高10倍,还需要3年;用GPU进行优化,提高10倍,还需要三个月。所以元知识学习对于计算能力要求是非常高的,这里面有越来越多的各种各样的元知识学习算法提出来,我们可以通过一些算法,可以比一般的算法提高10倍到100倍的速度,提高快速的知识的收敛和选择。

  最后我们简单讲一下,我们中国的量化投资到底发展到什么程度。我们做一件事情,我们市场上其实量化投资就是聪明人和噪声交易者,我们叫做一般的投资人之间的一个博弈的关系。我们可以看到,随着这个市场上聪明的人越来越多,量化投资会怎么样?它的胜率会越来越高。但是由于更多的人参与这个交易会怎么样?波动性也会随着量化投资逐渐变小,会出现一个峰值的分布。


  中国的量化投资现在市场上策略的夏普比大概是在2.5%到3%左右,整个市场的情况其实和我们对于散户和机构之间的相互关系是非常吻合的,散户和机构的相对比例是二八的分布,所以这个从一定程度告诉我们,其实中国还有很长的一段路走,但是我们将面临的是收益率下降,波动性下降,大家需要放杠杆。但是长期以来,会逐渐地搜索到整个收益率下降、夏普也下降的一个过程,但是我们远远还没有到,还有一段路要走,通过这个模型可以看到我们将来的一个发展方向,其实美国已经发展到这个方向。

  第二个,因为利润下降,不再好意思跟客户收业绩提成了,怎么办?在美国有一个非常大的发展方向,叫做对冲基金零售化,也就是原来都是对冲基金,逐渐的公募基金在发很多的产品。

  第三,不仅是投资要降低成本,顾问也要降低成本。整个的智能投顾的发展,其实和量化投资利润的发展,降低人工服务的成本息息相关。我的报告就到这里,谢谢大家!


推荐阅读
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 鄂维南:从数学角度,理解机器学习的「黑魔法」,并应用于更广泛的科学问题...
    作者|Hertz来源|科学智能AISI北京时间2022年7月8日晚上22:30,鄂维南院士在2022年的国际数学家大会上作一小时大会报告(plenarytalk)。今 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 本文介绍了新款奇骏的两个让人上瘾的功能,分别是智能互联系统和BOSE音响。通过对新款奇骏的配置和功能进行评测,探讨了这两个新增功能的使用体验和优势。此外,还介绍了新款奇骏的其他配置和改进,如增加的座椅和驾驶辅助系统,以及内饰的舒适性提升。对于喜欢音响的消费者来说,BOSE音响的升级也是一个亮点。最后,文章提到了BOSE音响的数字还原能力,以及7座版无法配备BOSE音响的原因。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • Tomcat/Jetty为何选择扩展线程池而不是使用JDK原生线程池?
    本文探讨了Tomcat和Jetty选择扩展线程池而不是使用JDK原生线程池的原因。通过比较IO密集型任务和CPU密集型任务的特点,解释了为何Tomcat和Jetty需要扩展线程池来提高并发度和任务处理速度。同时,介绍了JDK原生线程池的工作流程。 ... [详细]
  • 企业数据应用挑战及元数据管理的重要性
    本文主要介绍了企业在日常经营管理过程中面临的数据应用挑战,包括数据找不到、数据读不懂、数据不可信等问题。针对这些挑战,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。文章提出了“灵魂”三问——元数据是什么、有什么用、又该怎么管,强调了元数据管理在企业数据治理中的基础和前提作用。 ... [详细]
  • 关于CMS收集器的知识介绍和优缺点分析
    本文介绍了CMS收集器的概念、运行过程和优缺点,并解释了垃圾回收器的作用和实践。CMS收集器是一种基于标记-清除算法的垃圾回收器,适用于互联网站和B/S系统等对响应速度和停顿时间有较高要求的应用。同时,还提供了其他垃圾回收器的参考资料。 ... [详细]
  • 如何使用代理服务器进行网页抓取?
    本文介绍了如何使用代理服务器进行网页抓取,并探讨了数据驱动对竞争优势的重要性。通过网页抓取,企业可以快速获取并分析大量与需求相关的数据,从而制定营销战略。同时,网页抓取还可以帮助电子商务公司在竞争对手的网站上下载数百页的有用数据,提高销售增长和毛利率。 ... [详细]
  • ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES
    一、认识ElasticSearch是一个基于Lucene的开源搜索引擎,通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索,分析系统&# ... [详细]
  • 杭州PHP大厂有哪些(2023年最新分享)
    导读:今天编程笔记来给各位分享关于杭州PHP大厂有哪些的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: ... [详细]
  • AI行业的下一个风口是医疗?创业者们这样说
    ▼点击上方蓝字关注网易智能为你解读AI领域大公司大事件,新观点新应用编者按:4月10日,鲸准AI产业价值峰会在北京举行。本次大会除了邀请A ... [详细]
author-avatar
丁城雨
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有