表示学习:自动从原始输入中提取潜在因子或特征(例如,非线性风险因子)。
可扩展性:许多参数,但使用随机优化和正则化进行训练。
归纳偏差:
| MLP | CNN | RNN | GNN |
|---|---|---|---|
| 对一般表格数据灵活。 | 本地模式与平移不变性(对术结构信号如期限结构或限价单本有用)。 | 收益、波动性或流动性的顺序依赖。 | 图的关系(对手、供应链、所有权)。 |
对应于输入空间中的 线性决策边界。
|
|
MLP 可用于执行对多种数据类型的分类和回归。我们在下面给出了一些示例。
亲自尝试 通过: https://playground.tensorflow.org
|
|
优缺点
| 方面 | 优点 | 缺点 / 风险 |
|---|---|---|
| 灵活性 | 通用逼近器,丰富的非线性 | 小样本容易过拟合 |
| 数据格式 | 对表格、横截面数据表现良好 | 没有内置的序列/图的归纳偏见 |
| 优化 | 基于 SGD 的训练可扩展到大数据集 | 非凸的,局部最小值、鞍点 |
| 可解释性 | 可以通过架构嵌入经济约束 | 比线性/树模型难以解释 |
优缺点
| 方面 | 优点 | 缺点 / 风险 |
|---|---|---|
| 归纳性 | 捕捉局部模式,平移不变性 | 如果没有局部结构则不太适用 |
| 效率 | 比稠密层更少的参数 | 架构选择可能是临时的 |
| 数据类型 | 在序列和网格上表现良好 | 可能需要许多过滤器/层 |
| 可解释性 | 过滤器有时可解释为“图案” | 仍然不如线性模型透明 |
模型 / 算法
关键结果
为何激励深度序列模型
所以更新门在旧状态和新候选之间插值。
直觉
优缺点
| 方面 | 优点 | 缺点 / 风险 |
|---|---|---|
| 序列性 | 自然适用于时间序列和序列 | 难以在时间上进行并行化 |
| 记忆性 | 可以捕捉中期/长期依赖 | 对于非常长程的依赖仍然存在困难 |
| 灵活性 | 许多变体(堆叠的、双向的) | 有许多超参数,调优困难 |
金融用例:
优缺点
| 方面 | 优点 | 缺点 / 风险 |
|---|---|---|
| 长程依赖性 | 更好地处理长程依赖性 | 增加复杂性和参数 |
| 可解释性 | 权重 |
不总是完全具有因果性 / 可解释性 |
| 灵活性 | 支持 RNN 编码器/解码器、集合等 | 仍然依赖于序列长度 |
|
|
|
|
GAN 建立了生成器和判别器之间的双人游戏:
最小最大目标鼓励生成器使真实数据分布一致,判别器成为强大的分类器。
实际训练使用变体(例如,Wasserstein GAN)以提高稳定性,减少模式崩溃。
在金融中,GAN 可以生成现实的回报、波动性或收益曲线的联合情景,用于压力测试和数据增强。
判别器还充当 表示学习器:其内部层学习区分在市场中典型与非典型模式的特征,这些特征有时可以重用于风险监控或异常检测。
优缺点
| 模型 | 优点 | 缺点 / 风险 |
|---|---|---|
| VAE | 概率性、显式潜在结构 | 重建可能过于“平滑” |
| GAN | 清晰、现实的样本 | 训练不稳定、模式崩溃 |
VAE 和 GAN 是核心的深度生成模型,学习近似复杂的数据分布。
VAE 使用 概率潜变量 框架,通过编码器和解码器优化 ELBO。
GAN 将生成建模框架化为 双人游戏 生成器与判别器之间的博弈。
在金融中,它们主要用于 情景生成、压力测试和数据增强,而不是直接替代结构模型或风险因子框架。
问题
模型 / 算法
关键结果 / 洞察
为何适合深度生成模型
问题
模型 / 算法
关键结果
为何适合深度/RL 问题
直觉
优缺点
| 方面 | 优点 | 缺点 / 风险 |
|---|---|---|
| 结构 | 尊重网络拓扑 | 需要图数据和质量边缘 |
| 灵活性 | 学习复杂的邻域交互 | 多层可能导致过度平滑 |
| 金融应用 | 自然适用于系统性风险、传染、溢出 | 可解释性可能具有挑战性 |
金融应用:
系统性风险:使用银行间网络预测违约概率或损失。
信用风险:综合供应链或所有权网络。
市场结构:建模由客户-供应商关系连接的公司或部门之间的溢出效应。
GNN 将神经网络推广到图结构数据,通过 消息传递和邻域聚合。
它们学习节点、边或整个图的表示,隐式捕捉 网络结构和交互。
在金融中,GNN 是建模 相互关联系统(如银行网络、所有权结构和供应链关系)的有前景工具。
与基于表格数据的 MLP 相比,GNN 强调结果在 关系 上的关键依赖,而不仅仅是孤立特征。
再次强调,网络架构塑造了学习的容易性:通过图结构,模型偏向于捕捉 关系模式和传染效应。
如果本讲slides用到mermaid charts,slides末尾应有以下内容