热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

量化投资进化论

新浪财经讯金麟2017第四届量化投资与对冲基金年会3月25日在中国人民大学举办。国金基金量化投资总监林建武作了主题演讲《量化投资进化论》,他表示量化投资未来主要有三个

  新浪财经讯 金麟2017第四届量化投资与对冲基金年会3月25日在中国人民大学举办。国金基金量化投资总监林建武作了主题演讲《量化投资进化论》,他表示量化投资未来主要有三个趋势:第一,量化投资的全球化的方向;第二,量化投资的智能化的方向;第三,量化投资的机构化方向。

  以下为演讲实录:

  林建武:非常感谢丁总,感谢李教授邀请我来参加这个会,我是清华大学毕业的,回到人大的校园也很亲切,因为我曾经还有一个身份,是北京市小作家协会的主席,我们的总部在人大附中。

  我在华尔街做了十几年,后来回到国内教书,然后又回到业界来做,其实遇到很多的朋友、学生都问,说林教授,中国的量化投资到底发展到什么程度了?我们学生学了以后,将来有没有就业的机会,是不是可以赚到钱?很多人都在问这个问题,所以我这次来到校园跟大家简单分享一下我自己做这么多年的经历,和我对于整个中国量化投资发展的一个想法,跟大家分享一下。

  说到量化投资,我们肯定要看一下量化投资的趋势,我讲三个方向。第一,量化投资的全球化的方向;第二,量化投资的智能化的方向;第三,量化投资的机构化方向。

  先讲一下量化投资的全球化,大家看一下这幅图,讲的是全球量化投资对冲基金发展的历程。大家知道最早的对冲基金是1949年建立的,当时起家的时候只有10万美金,以200亿美金管理资产作为一个分界线的话,美国大概花了四五十年的时间达到这样一个规模;欧洲是2002年左右达到200亿美金,用了三四十年。

  亚洲,不包括中国,达到200亿美金是2006年,用的时间是二十年左右。首先我说中国,我觉得中国发展的进程肯定会比欧美快,像我们这样的从国外回来的非常多的人,会带来国外原来发展的技术跟大家分享,很多人也到国外去学习这方面的技术,它的发展进程是越来越快的。

  这个发展的进程对于每一个国家,它有什么样的影响呢?当然有很多好的一些影响,流动性的影响、各种各样的影响。但是我要跟大家分享的一点,其实很多做量化对冲的人可能都会意识到,也就是量化对冲对于整个市场的影响。

  美国有一个著名的指数公司,就是摩根斯坦利的MICI,现在分化出去了,它做的是全球各个不同国家的指数和全球的MICI指数之间的相关性,大家可以看到2007年之前这个相关性各有千秋,有的高、有的低,是一个非常广泛的分布曲线。但是到了2007年以后,经过次贷危机之后,也是量化投资不断发展之后,大家发现很多国家的股票指数和全球股票指数呈现了大规模的相关性。大家可以看到,整个的相关性在不断地变高。

  那么我们做量化对冲的都知道,量化对冲最核心的多空策略,选好的股票、做空差的股票,如果所有的股票同涨同跌我们怎么办?利润会下降。所以相关性来自于量化对冲,同时它使量化对冲的利润在发展。所以全球量化对冲的发展也带来一个非常重要的影响,使得我们市场上很多资产的相关性在变得越来越相关。

  我们看一下全球整个的发展,在欧美国家,美国、欧洲整个市场的相关性已经达到了50%、60%,甚至有的时候达到70%,这每个尖都代表着一次灾难,比如说希腊的国债危机、雷曼兄弟倒闭,当市场有大规模的市场性的信息的时候,就会造成市场上有更多的股票同涨同跌。比如说日本突然发生地震的时候,大家不再关心公司在日本到底在做什么,而是整个市场的相关。

  亚洲的相关性还是比较低的,整体的相关性在百分之三四十,所以在近些年有越来越多的对冲基金进军到亚洲,为什么?这是一个量化投资的天堂,它的相关性是比较低的。

  我们看一下,我这里做了一个很简单的图,画的是从2010年到2016年整个中国市场的一个市场相关性的发展,其实就是把两两的股票做一个相关性,做一个均值。大家可以看到,中国的市场整个的相关性也在不断升高,从大概10%到20%,一直升到50%、60%。上面画的一条是市场上所有的可以得到公开数据的α策略的均值,整个α策略总体的收益在相关性比较低的时候还是比较值的,当相关性升到一定程度的时候,越来越多的回撤发生了。所以各种各样的回撤从数学的角度来说,正是相关性影响的一个非常重要的原因。

  所以它告诉我们一件什么事情,其实我们在中国做量化投资,我们需要更多的多样性,其实多样性正在悄悄地在我们整个资产的配置中越来越重要,因为我们需要更多的另类资产来进行投资,不然的话你就会陷入一个相关性的误区。

  我们需要越来越多的策略,我们就必须要有更多的研究员去进行数据的分析和挖掘,对于数据分析这一块提出了更高的要求;它也使我们进入到整个应用人工智能和其他的一些领域,来促进我们量化投资,不仅是投资的自动化,而是投资策略的自动化和智能化。

  我这里把量化投资分成几个部分,量化投资可以把它抽象成三个部分的环节,第一个部分是我们有很多的金融的时间序列,也就是我们的金融数据。第二个部分我们叫做自适应的交易算法;第三个部分是很多程度我们还要依靠人,就是我们人的策略师,大家要不断地从这些策略里挑出好的策略。

  我们看一下人工智能会对于这三个方面情况做什么样的促进呢?第一块,我们知道其实我们还有很多的信息是非结构化式数据,不管是文本的、图像的、声音的还有其他的数据,是没有办法变成现在数据模型可以直接处理的数据的这种结构化数据,所以我们要利用人工智能的方法把它处理成结构化数据来进行交易。

  第二块是我们人工智能的算法,其实人工智能的算法大家说了很多,我总结一句,从我们数学的角度上来说,很多的人工智能算法就是非线性建模,它其实就是告诉我们,我们在我们遇到的数据里头,它的非线性成分越来越多,线性的东西被交易之后,逐渐地出现一些非线性的现象,我们需要很多的人工智能算法进行学习和总结。

  第三个部分,其实也是现在人工智能正在逐渐发展的一个难的领域,很多人都在尝试,我们叫做元知识学习,就是说我们原来去选一个策略去投资不同的资产,元知识学习是让我们怎么样来用机器选择不同的投资策略。其实大家可以看到,元知识学习逐渐开始使我们的人工智能有了产生知识的可能性,原来只是运用知识自动化地处理数据,而元知识学习是人工智能的一个高的层次。

  下面我们就这三个方面分别跟大家简单介绍一下,现在人工智能在量化投资的一个发展方向。

第一个方向是非结构化数据,我们讲一个简单的例子,2013年的4月23日,当时美联社发了一个推特的文章,说两颗炸弹在白宫爆炸,奥巴马总统被炸伤了。我们可以看一下,当时在一分钟之内标准普尔发生了什么事情,在一分钟之内暴跌了1%,按照美国当时的标准普尔的市值,其实在一分钟之内瞬间蒸发了1360亿美金,当然很快证明是一个假的推文,又回来了。说明什么?这是人工交易员交易的吗?不大可能,美国有大量的对冲基金使用推特上的数据进行自动化的交易。所以大家可以看到,新闻的非结构化自动交易在美国很多的高频交易公司已经广泛地使用。

  第二幅图是我美国加州的一个朋友给了一幅图,很有意思,跟大家分享一下。这幅图是美国一家公司,叫做RS Metrics,是一家军用的卫星公司,后来转了民用,这幅图是卫星航拍的俯视图,这是一家沃尔玛,这是一个停车场。大家可以想象停车场停车的数量跟人流量有关,人流量跟超市的销售量有关,销售量跟超市的利润有关。如果你可以把沃尔玛所有的停车场的数目和以前的停车场的数目进行对比,你可以算出沃尔玛这个季度的销售量是增量还是减量。算的以后,沃尔玛公司是一个上市公司,我们可以用这个方法在沃尔玛发季报之前,猜出来它发出来的季报是超预期还是低于预期,我们可以赚钱。

  所以大家可以看到,新闻可以做,图像也可以做量化投资。所以人工智能这种图像识别、文字识别,甚至语音识别,正在悄悄地走入量化投资,帮助我们扩展量化投资非常重要的食粮,也就是它的数据源。

  我们再讲第二块,人工智能的算法。我们先看一下整个金融学的发展规律,以前很长的时间里头我们根本就没有金融学,金融学一直到了17世纪、18世纪,才和经济学逐渐并存;到了19世纪、20世纪,才出现了大量的各种各样的金融学理论,所以我们正在从市场的定性分析变成定量分析。

  但是难道我们人是变得越来越聪明了吗?并不是这样。其实大家可以看到,有一件事情正在悄悄地影响我们整个的市场,也就是随着整个人类社会的不断发展,我们在积累不断的数据,只有有了大量的数据,我们从逐渐从定性分析发展到定量分析。

  同样,我们看一下整个人类投资的金字塔,人类投资最早的时候使用的是Buy-To-Hold,就是买了一支股票不动,持股20年。然后是Fundamental,其实正是市场上的数据越来越多,造成了我们进行越来越多的数据分析,我们有了交易所、行情,进行日的数据、分钟级的数据、毫秒级的数据,其实随着数据越来越多,来的频率越来越快,所以才产生了更多的量化投资,从量化投资统计套利、高频到做市,整个量化投资模型的发展,整个处理方式的发展,其实和整个这个社会金融数据的膨胀发展,不管是从数量还是频率,都是息息相关的。

  跟大家做一个简单的演示,演示一下我们数据建模的一种方法。假设我们看到这幅图,大家觉得这是什么东西?唯一的方法我们怎么做?做个线性建模,颜色深的分成一块,颜色浅的分成一块,我们好像看见了三个东西,慢慢可以把它圈出来,然后开始非线性建模,现在就看出来了,是企鹅。正是随着我们得到的数据越来越多,我们的模型从线性逐渐变成非线性,从简单的模型到复杂的模型。

  其实量化投资也是同样的情况,量化投资借助着我们前面越来越多的人工智能处理更多的数据,也正在从完全的线性的人工建模进入到非线性的建模。最早的时候量化投资很多人去读各种各样的技术分析,其实它都是非常简单的建模,而是都是靠交易员长期观察市场来得到的,它的这些指标里头、评价的一些标准,最后整个数据的结构,全部都是人来进行建立。

  随着我们有了更多的指标,很多人在用遗传算法,把好的留下来,差的去掉。所以慢慢指标这一块可以开始通过计算机来选择,但是后面的数据结构还需要人来定。

  我们将来有一天如果这个机器真能把神经元网络也自己猜出来,我估计咱们人类历史就有可能结束了。但是这个东西到底能不能来到这一天我也不知道,但是通过这个东西大家可以看到,我们整个的量化投资正在越来越地使用机器替代原来人做的这个东西。

  我们可以看一下,最后我们讲一下元知识学习。元知识学习我不讲太多,我们刚才讲了量化投资其实是一个非线性建模,同时人工智能用一句话说就是一个优化算法,就是一个非线性优化算法,你想要实现人工智能,最主要的是一个计算能力。

  给大家举一个简单的例子,我们假设我们有100个策略,每个策略有1000个测试题,每个策略同时又四个参数,每个参数都是从1取到10,那么要有10000个参数,每次仿真需要100秒的时间,这样一个简单的选取就是要花1的11次方秒,相当于3000年。这个太傻了,我们需要并行计算,如果我们需要100个CPU进行并行计算,还是需要30年;如果我们用遗传算法可以提高10倍,还需要3年;用GPU进行优化,提高10倍,还需要三个月。所以元知识学习对于计算能力要求是非常高的,这里面有越来越多的各种各样的元知识学习算法提出来,我们可以通过一些算法,可以比一般的算法提高10倍到100倍的速度,提高快速的知识的收敛和选择。

  最后我们简单讲一下,我们中国的量化投资到底发展到什么程度。我们做一件事情,我们市场上其实量化投资就是聪明人和噪声交易者,我们叫做一般的投资人之间的一个博弈的关系。我们可以看到,随着这个市场上聪明的人越来越多,量化投资会怎么样?它的胜率会越来越高。但是由于更多的人参与这个交易会怎么样?波动性也会随着量化投资逐渐变小,会出现一个峰值的分布。


  中国的量化投资现在市场上策略的夏普比大概是在2.5%到3%左右,整个市场的情况其实和我们对于散户和机构之间的相互关系是非常吻合的,散户和机构的相对比例是二八的分布,所以这个从一定程度告诉我们,其实中国还有很长的一段路走,但是我们将面临的是收益率下降,波动性下降,大家需要放杠杆。但是长期以来,会逐渐地搜索到整个收益率下降、夏普也下降的一个过程,但是我们远远还没有到,还有一段路要走,通过这个模型可以看到我们将来的一个发展方向,其实美国已经发展到这个方向。

  第二个,因为利润下降,不再好意思跟客户收业绩提成了,怎么办?在美国有一个非常大的发展方向,叫做对冲基金零售化,也就是原来都是对冲基金,逐渐的公募基金在发很多的产品。

  第三,不仅是投资要降低成本,顾问也要降低成本。整个的智能投顾的发展,其实和量化投资利润的发展,降低人工服务的成本息息相关。我的报告就到这里,谢谢大家!


推荐阅读
  • 兆芯X86 CPU架构的演进与现状(国产CPU系列)
    本文详细介绍了兆芯X86 CPU架构的发展历程,从公司成立背景到关键技术授权,再到具体芯片架构的演进,全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 图像分割技术在人工智能领域中扮演着关键角色,其中语义分割、实例分割和全景分割是三种主要的方法。本文对这三种分割技术进行了详细的对比分析,探讨了它们在不同应用场景中的优缺点和适用范围,为研究人员和从业者提供了有价值的参考。 ... [详细]
  • 每日一书丨AI圣经《深度学习》作者斩获2018年图灵奖
    2019年3月27日——ACM宣布,深度学习之父YoshuaBengio,YannLeCun,以及GeoffreyHinton获得了2018年的图灵奖, ... [详细]
  • TensorFlow入门上
    前置准备在阅读本文之前,请确定你已经了解了神经网络的基本结构以及前向传播、后向传播的基本原理,如果尚未了解,可以查看下文。神经网络初探​chrer.com也可以直接在我博客阅读Te ... [详细]
  • 2020年9月15日,Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性,包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 当前物联网领域十大核心技术解析:涵盖哪些关键技术?
    经过近十年的技术革新,物联网已悄然渗透到日常生活中,对社会产生了深远影响。本文将详细解析当前物联网领域的十大核心关键技术,包括但不限于:1. 军事物联网技术,该技术通过先进的感知设备实现战场环境的实时监测与数据传输,提升作战效能和决策效率。其他关键技术还包括传感器网络、边缘计算、大数据分析等,这些技术共同推动了物联网的快速发展和广泛应用。 ... [详细]
  • Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性,但Python作为一种通用编程语言,适用于更广泛的领域,包括Web开发、自动化脚本和机器学习等。对于初学者而言,Python的学习曲线更为平缓,上手更加容易。此外,Python拥有庞大的社区支持和丰富的第三方库,使其在实际应用中更具灵活性和扩展性。 ... [详细]
  • 表面缺陷检测数据集综述及GitHub开源项目推荐
    本文综述了表面缺陷检测领域的数据集,并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理,为研究人员提供了全面的资源参考,有助于推动该领域的发展和技术进步。 ... [详细]
  • 深入解析 Unity URP/SRP 渲染管线:匠心打造的全面指南
    本文深入探讨了Unity中的URP、SRP和HDRP渲染管线,详细解析了它们之间的关系及各自的特点。首先介绍了SRP的基本概念及其在Unity渲染架构中的作用,随后重点阐述了URP和HDRP的设计理念与应用场景。文章还分析了SRP诞生的背景,解释了为何Unity需要引入这一灵活的渲染框架,以满足不同项目的需求。通过对比URP和HDRP,读者可以更好地理解如何选择合适的渲染管线,以优化项目的性能和视觉效果。 ... [详细]
  • 高端存储技术演进与趋势
    本文探讨了高端存储技术的发展趋势,包括松耦合架构、虚拟化、高性能、高安全性和智能化等方面。同时,分析了全闪存阵列和中端存储集群对高端存储市场的冲击,以及高端存储在不同应用场景中的发展趋势。 ... [详细]
  • 深入浅出解读奇异值分解,助你轻松掌握核心概念 ... [详细]
  • 到了今天,已经很少有人再提人工智能音箱了。使用率低、售价跳水、缺乏销售数据……我们不能武断地说智能音箱凉了,但的确不少所谓的AI企业的硬件梦碎了。相对于一 ... [详细]
author-avatar
丁城雨
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有