Python机器学习之金融风险管理
上QQ阅读APP看书,第一时间看更新

前言

随着计算能力的提高,计算机能够对大型数据集进行分类,可以对大量数据进行处理以识别模式和异常值,人工智能(Artificial Intelligence,AI)和机器学习(Machine Learning,ML)成为技术领域的最新流行语,受到了我们的关注。

——BlackRock(2019)

金融建模有着悠久的历史,它成功地完成了许多任务,但由于模型缺乏灵活性和兼容性等问题受到了激烈的批评。2008年的“金融危机”令争论更激烈,最终引发了金融建模领域的各种创新。

当然,金融危机并不是推动AI在金融领域应用增长的唯一因素,还有另外两个因素:数据可用性和计算能力的提高。

金融稳定委员会(Financial Stability Board,FSB)于2017年提出:

金融业已经有很多使用AI和ML的应用或用例。这些用例既受到供应因素(例如技术的进步以及金融部门数据和基础设施的可用性)的推动,也受到需求因素(例如盈利能力需求、与其他公司的竞争以及金融监管的要求)的推动。

作为金融建模的一个分支,金融风险管理随着AI在金融决策过程中的作用不断增强而不断发展。正如Nick Bostrom在他那本著名的《超级智能》一书中所提到的,人类历史上有两次重要的革命:农业革命和工业革命。这两次革命带来了十分深远的影响,基于这两次革命的历史推断,与之规模相当的第三次革命会在两周内令世界经济规模翻一番。更引人注目的是,如果第三次革命是由AI完成的,那么其影响将更加深远。

因此,人们对AI应用的期望非常高,希望这些应用能够利用大数据来理解风险过程的复杂结构,从而重塑金融风险管理。

我希望通过本书推广ML在金融领域的应用,从而提高金融模型的预测能力和性能。参数模型存在低方差和高偏差的问题,而ML模型的灵活性可以解决这些问题。金融领域的一个常见问题是,数据分布的变化总是会对模型结果的可靠性构成“威胁”,而ML模型可以根据变化的模式进行自我调整,使模型更加适应数据的变化。因此,金融领域对于适用的ML模型有着巨大的需求,而本书的主要特点是在金融风险管理中引入全新的基于ML的建模方法。

简而言之,本书的目的是改变目前严重依赖于参数模型的金融风险管理的现状,主要基于ML模型的高度准确的金融模型的最新发展。本书是为那些对金融和ML有初步了解的人准备的,因此我将只是简单地解释一下这些基础知识。

本书的目标读者包括但不限于金融风险分析师、金融工程师、风险分析助理、风险建模师、模型验证师、定量风险分析师、投资组合分析师以及所有其他对金融和数据科学感兴趣的人。

如果读者具有以上背景,或者具有入门级别的金融和数据科学知识,应该会从本书中受益良多。但是,这并不意味着没有这些背景和基础的人就不能理解本书的知识。只要读者能够花足够的时间来研究,并在阅读本书的同时参考其他一些金融和数据科学图书,一样能够掌握本书的知识。

本书涵盖的内容

第1章,“风险管理基础知识”

本章介绍风险管理中的主要概念,包括什么是风险、主要的金融风险类型,解释了风险管理等。然后讨论金融风险管理中的信息不对称问题,重点讨论逆向选择和道德风险。

第2章,“时间序列建模简介”

本章主要介绍传统的时间序列建模方法,包括MA、AR和ARIMA模型。本章的主要目的是为传统时间序列建模方法和最新时间序列建模方法(第3章主要内容)的比较提供基准。

第3章,“使用深度学习进行时间序列建模”

本章介绍如何使用深度学习进行时间序列建模,主要讲解RNN和LSTM两种方法。

第4章,“基于ML的波动率预测”

金融市场一体化程度的日益提高导致金融市场的长期不确定性,这反过来又体现了波动率的重要性。波动率可用于测量风险程度,这是金融领域中的主要业务之一。本章不仅介绍基于SVM、神经网络、深度学习和贝叶斯方法的新型波动率建模,还介绍了ARCH模型、GARCH模型、GJR-GARCH模型、EGARCH模型、SVR-GARCH模型。

第5章,“市场风险建模”

本章首先介绍多个VaR建模方法。其次,尝试以噪声和信号的形式区分信息,即降噪。然后,采用降噪协方差矩阵来改进VaR估计。接下来,讲解如何用ES模型作为一个连贯风险衡量指标。最后,讲解考虑流动性风险之后的ES模型和实际成本。

第6章,“信用风险估计”

本章首先讲解与信用风险相关的主要概念。然后,使用逻辑回归、贝叶斯模型、SVM、随机森林、神经网络、深度学习基于德国信用风险数据集进行预测分析。

第7章,“流动性风险建模”

本章介绍一种基于GMM的流动性风险建模新方法,该方法允许我们基于多个流动性指标数据进行建模并生成聚类。鉴于这些聚类的后验概率,我们能够确定哪个聚类代表数据的定义特征。然而,如果不考虑流动性指标的相关性,我们的模型很可能无法适用于现实工作。因此,为了解决这个问题,我们引入考虑了变量之间的相关性的GMCM。

第8章,“运营风险建模”

由于ML建模的发展,我们现在有更多的工具可以用来应对欺诈行为,本章介绍包括逻辑回归、决策树、随机森林等在内的监督学习方法,以及目前较新的、十分适用于管理欺诈风险的成本敏感学习方法;然后,介绍自组织映射和自编码器等无监督学习方法。

第9章,“公司治理风险度量:股价崩盘”

本章介绍全新的方法来应对公司治理风险——股价崩盘。许多研究发现,股价崩盘与公司治理之间存在联系,本章使用最小协方差行列式和面板数据分析来揭示公司治理风险成分与股价崩盘的关系。

第10章,“金融中的合成数据生成与HMM”

本章介绍两个相对较新但很有前景的主题:合成数据生成与HMM。合成数据生成使我们能够在缺乏真实数据或遵守保密规定的情况下进行分析,因此它可以成为从业人员的“救命稻草”。然后,我们介绍高斯HMM模型及其使用方法,利用HMM模型生成合成数据。

本书约定

该图标表示技巧、建议或一般性注释。

该图标表示警告或重要的注意事项。

示例代码的用法

本书的补充资料(示例代码等)都可以从异步社区下载。

本书提供源代码的目的是帮你快速完成工作。在一般情况下,你可以在自己的程序或文档中使用本书中的代码,而非复制书中的部分代码,这样就不必取得我们的许可。例如,当你在编写程序时,用到了本书的几个代码段,这不必取得我们的许可。但若将O’Reilly图书中的代码进行出售或传播,则需获得我们的许可。引用示例代码或书中内容来解答问题无须获得我们的许可。当将书中很大一部分的示例代码用于你个人的产品文档时,则需要获得我们的许可。

如果你引用了本书的内容并标明版权归属声明,我们对此表示感谢,但这不是必须做的。版权归属声明通常包括标题、作者、出版社和ISBN。

如果你认为你对示例代码的使用已经超出上述范围,或者你对是否需要获得示例代码的授权还不清楚,请随时联系我们:permissions@oreilly.com。

O’Reilly在线学习平台(O’Reilly Online Learning)

40多年来,O’Reilly Media一直致力于提供技术和商业培训、知识和卓越的见解,以帮助公司取得成功。

我们拥有独一无二的专家和革新者组成的庞大网络,他们通过图书、文章、会议和我们的在线学习平台分享他们的知识和经验。O’Reilly的在线学习平台允许读者按需访问现场培训课程、深入的学习路径、交互式编程环境,以及O’Reilly和200多家其他出版商提供的大量文本和视频资源。更多相关信息请访问O’Reilly官网。

如何联系我们

美国:

O’Reilly Media,Inc.

1005 Gravenstein Highway North

Sebastopol,CA 95472

中国:

北京市西城区西直门南大街2号成铭大厦C座807室(100035)

奥莱利技术咨询(北京)有限公司

欢迎读者对本书提出意见或指出技术问题,请发送电子邮件至errata@oreilly.com.cn。

若要获取有关我们的图书、课程、会议和新闻的更多信息,请访问O’Reilly官网。

致谢

决定写这本书并非一时兴起。我发现业界缺乏基于ML模型构建主要金融风险管理模型的资料。本书致力于将ML应用于金融风险管理问题。我希望通过本书从各个角度为模型提供理论、经验、方法以及可复制的代码。当我与O’Reilly的Michelle Smith分享这个想法时,Michelle深表赞同并不断地鼓励我写作。Michelle对本书的完成充满信心,并一路支持我,对此我非常感激。

每当完成新的章节,我就马上与我的编辑Michele Cronin沟通。此外,我们每周还会进行一次内容丰富而有趣的交流,从而保证我一直走在正确的道路上,并得到从编辑视角出发的指导观点。随着章节写作的不断进展,每一章都有新的挑战,需要我夜以继日地应对。这导致我越来越疲惫,越来越难以发现错别字和其他类型的错误。这正是技术审稿人发挥宝贵作用的地方。在此我非常感谢本书的技术审稿人Mehmet Benturk、Hariom Tatsat、Isaac Rhea、Dimitri Bianco、McKlayne Marshall和Michael Shearer,感谢他们为本书所付出的努力。

另外,我还要感谢Danny Elfanbaum和Randy Balaban在文本一致性方面的复核。在经历了漫长曲折的一年后,我终于完成了枯燥乏味但又激动人心的人生里程碑,希望本书能为那些希望学习金融领域ML的人指明道路。

在此向那些为本书做出贡献的人表达我最深切的谢意。

作者