第8讲

金融研究中的因果推断和机器学习


该版为机翻版本,未经人工校对,建议配合原版使用。

Financial Machine Learning · Lecture 8

大纲

Financial Machine Learning · Lecture 8

第一部分 · 因果推断的理论框架

  • 重要性: 将机器学习与因果推断结合,以在高维、非线性经济和金融数据中实现可靠的处理效应估计——改善偏差减少、揭示异质效应,并支持稳健的政策和决策分析。

  • 重点:

    • 潜在结果框架和识别条件(SUTVA、无关性、重叠)。
    • 经典因果方法:回归调整、倾向评分匹配、IV/2SLS、DiD、RDD。
    • ML增强的因果工具:Lasso(变量选择)、选择后推断、双重选择;双重/去偏机器学习(交叉拟合、正交分数);因果树和因果森林用于异质处理效应;TMLE用于目标估计。
    • 实际关注:模型选择、稀疏性、诊断检查(平衡、工具有效性、平行趋势)和敏感性分析。
Financial Machine Learning · Lecture 8

潜在结果模型

  • 设:

    • :无处理的潜在结果。
    • :有处理的潜在结果。
  • 观察到的结果:

Financial Machine Learning · Lecture 8

潜在结果模型:处理效应

  • 个体处理效应

    • 隐形,因此不可行
  • 平均处理效应(ATE)

  • 接受处理的平均处理效应(ATT)

Financial Machine Learning · Lecture 8

随机对照试验(RCTs)

  • RCTs:随机分配至处理/对照组。
  • 对照组用作测量处理效应的基线。
  • 旨在促进与反事实情境(无处理结果)的比较。
Financial Machine Learning · Lecture 8

RCTs:随机分配的重要性

  • 减少选择偏差,确保组间可比性。
  • 有助于通过控制外部因素来建立可信的因果关系。
Financial Machine Learning · Lecture 8

RCTs:假设(SUTVA)

  • *稳态单位处理价值(SUTVA)*假设:某个个体的处理效果不影响其他个体的结果。
  • 替代模型将假设 ,即个体的结果依赖于其他个体的处理状态。
Financial Machine Learning · Lecture 8

RCTs:假设(随机分配)

该假设表示潜在结果与处理的独立性,当且仅当处理是随机分配的,与个体的潜在结果无关。

通过比较处理组和对照组的平均结果,我们得到:

其中 表示(平均)处理效应。

Financial Machine Learning · Lecture 8

RCTs:均值差(DM)估计量

利用中心极限定理,我们得出估计量 具有渐近正态性:

其中

并且我们可以推导ATE的置信区间。

Financial Machine Learning · Lecture 8

RCTs:估计处理效应

假设:

  1. SUTVA:一个个体的处理效应不会影响其他个体。
  2. 随机分配:处理分配与潜在结果独立。

估计方法:

Financial Machine Learning · Lecture 8

RCTs:处理效应的OLS估计

  • 线性模型

  • 在标准假设下,OLS可以估计平均处理效应。
Financial Machine Learning · Lecture 8

条件独立性与倾向评分

关键假设

  • 条件独立性

倾向评分

  • 定义给定可观测特征的处理概率

  • 倾向评分使我们能够减少问题的维度,因为它满足:

  • 条件在倾向评分 下,处理分配 与潜在结果是独立的。
Financial Machine Learning · Lecture 8

表征ATE:使用反倾向加权(IPW)

  • 首先使用非参数回归 估计评分 p
    • 是离散且取值为 时,p 的自然估计是
    • 然后,我们使用:

    • 定义假设倾向评分已知的oracle估计量

    • $ \hat{\tau}_{IPW} $ 的渐近性质通过分解进行:

Financial Machine Learning · Lecture 8

注意到项 (B) 消失,因为 是无偏的:

假设(重叠条件)。 存在 使得,对于所有

假设结果变量是有界的 ,我们得到对oracle估计量 (A) 的距离的控制概率:

因此,在倾向评分的 sup-norm 收敛估计的充分条件下,,估计量 是一致的。

Financial Machine Learning · Lecture 8

表征ATE:回归函数差异

对于每个

其中 对于 ,因此

获取具有此特征的ATE一致估计量的一种方法是使用 的一致非参数估计量 ,然后在观察值上取平均:

Financial Machine Learning · Lecture 8

处理效应的有效估计

增强的反倾向评分(AIPW)估计量,由 Robins 等人(1994)和 Hahn(1998)定义,旨在修正 由于对 的估计而造成的偏差。它由以下给出:

此AIPW估计量具有两个重要属性:

  • 它达到了半参数效率界限(Robins等,1994;Hahn,1998),并且

    • 其中 对于
  • 它是双重稳健的,这意味着如果估计量 对于 是一致的,或者如果 是一致的,则它是一致的。

Financial Machine Learning · Lecture 8

工具变量(IV):内生性与工具变量

  • 随机实验 自然实验
    • 处理 不是随机的,因此与潜在结果不是独立的。
    • 考虑一个线性模型,允许估计处理 (离散或连续,并且此处维度为1)的效果,同时控制变量 (通常包括截距):

  • 外生性假设 可能不成立。
    • 定义量 使得

    • 假设
    • 普通最小二乘估计量将估计 ,这通常与真实参数 不同。
    • 是在 的最佳线性预测,但它不再是因果效应。

Financial Machine Learning · Lecture 8
  • 我们处于一个 但不是 的上下文中。

  • 策略:识别工具变量 ,其中 大于内生变量的数量(此处: 为标量)。

  • 工具变量定义:

    1. 与内生变量 相关。
    2. 与残差 无关。
  • 定义 为使用 的最佳线性预测:

Financial Machine Learning · Lecture 8
  • 正式假设

    • 假设(秩条件) 是非奇异的。
    • 假设(外生性)
  • 识别结果

    • 真实参数的形式为:

  • 相关性(低级条件)

    • 对于假设(3.5)的低级条件( 的相关性):
      • 是非奇异的。
Financial Machine Learning · Lecture 8

两阶段最小二乘法(2SLS)—— 直觉

  • 从识别公式的经验对应中获得的估计量就是两阶段最小二乘估计量。

  • 2SLS程序:

    1. 对工具 和控制变量 回归;获得 (预测)。
    2. 对预测的 和控制变量 回归。
  • 特殊情况:一个工具 且无控制:

Financial Machine Learning · Lecture 8

多个工具和变换

  • 研究人员可能有多个工具或考虑初始工具的变换

  • 如果对 的假设(3.6)成立,则条件矩 隐含无条件矩:

    对于任何工具向量 ,使得

  • 这引出了问题:如何选择 以最小化 的 GMM 估计量的渐近方差?

Financial Machine Learning · Lecture 8

效率考虑

  • 的选择不影响因果效应的识别,但会影响 2SLS(或 GMM)估计量的准确性。

  • 我们概述了关于最佳工具的经典结果。

  • 为了简单起见,仅限制于条件同方差性:

Financial Machine Learning · Lecture 8

IV:最佳工具变量

  • 设置和目标

    • 假设只有 是内生且标量;表示
    • 考虑基于工具 的 GMM 的矩条件,具有

    • 定义
  • GMM 估计量

    • GMM 估计量满足

      并且
Financial Machine Learning · Lecture 8
  • 渐近性质
    • 渐近正态性:

      其中

    • 最优的 最小化 的渐近方差。
Financial Machine Learning · Lecture 8

有效工具的必要条件

  • 定理(必要条件;Newey & McFadden,1994):
    如果存在有效的选择 ,则必须满足

    对于所有有

  • 等价地:

Financial Machine Learning · Lecture 8

通过迭代期望重构

  • 重新整理得:

  • 在条件同方差下

    该条件由以下满足:

Financial Machine Learning · Lecture 8

最优工具与效率界限

  • 由于将 乘以一个常数矩阵并不改变效率,所以 最小化渐近方差。
  • 结果最优对象表达式(半参数效率)为:

  • 解释:
    • 最优工具是回归函数
    • 达到了半参数效率界限(见 Van der Vaart,1998,第25章)。
Financial Machine Learning · Lecture 8

实践说明

  • 可能是高维的,且非参数估计具有挑战性。
  • 对于少量工具,Newey & McFadden(1994)建议使用系列(筛选)估计量来回归
  • 最优工具提高了精度,但不影响识别。
Financial Machine Learning · Lecture 8

关键概念总结

  • 关键术语:因果推断、RCT、处理效应、平均处理效应(ATE)、条件独立性、倾向评分、IV方法、局部平均处理效应(LATE)。
  • 参考文献
    • Angrist & Pischke (2009)
    • Imbens & Rubin (2015)
Financial Machine Learning · Lecture 8

第二部分 · 经典因果推断模型

  • DID
  • PSM
  • RDD
Financial Machine Learning · Lecture 8

差分中的差分(DID):介绍

  • 定义:

    • 差分中的差分(DID)是一种统计技术,用于通过比较治疗组和对照组在干预前后的结果来估计因果效应。
  • 目标:

    • 通过控制可能影响结果的未观察因素,隔离特定处理或政策的效果。
  • 适用问题:

    • 政策分析、经济干预、金融及社会科学中的项目评估。
Financial Machine Learning · Lecture 8

DID:基本概念

  • 模型 / 公式:

  • 假设:

    • 平行趋势假设: 如果没有处理,处理组和对照组会遵循相同的轨迹。
  • 因果推断分析:

    • DID 方法通过确保结果的任何变化可以归因于干预,而不是其他影响因素,帮助减少混杂因素的偏差。
Financial Machine Learning · Lecture 8

DID:关键组件

  • 处理组:

    • 接受干预的组。
  • 对照组:

    • 不接受干预的组,用于比较。
  • 时间段:

    • 干预前: 干预前的测量。
    • 干预后: 干预后的测量。
Financial Machine Learning · Lecture 8

DID:示例

  • 背景:

    • 分析金融监管放松(例如,废除《格拉斯-斯蒂格尔法》)对银行绩效的影响。
  • 数据:

    • 处理组: 受监管放松影响的银行。
    • 对照组: 没有受到影响的相似银行。
  • 观察:

    • 比较监管放松前后关键财务指标(例如,资产回报率、股票表现)以估计其影响。
Financial Machine Learning · Lecture 8

DID:实施步骤

  1. 确定处理组和对照组。
  2. 收集干预前后两个组的纵向数据。
  3. 计算两个组的结果变化。
  4. 使用DID公式估计因果效应。
  5. 使用干预前数据验证平行趋势假设。
Financial Machine Learning · Lecture 8

DID:局限性与考虑

  • 假设有效性:

    • 平行趋势假设在所有情况下可能不成立。
  • 混杂变量:

    • 外部因素可能扭曲结果;控制这些因素至关重要。
  • 数据质量:

    • 需要可靠的纵向数据和适当的样本量以获得有意义的结果。
Financial Machine Learning · Lecture 8

DID:机器学习的应用

  • 最新文献:
    • 机器学习技术可以应用于改进DID模型,通过:
      • 改善倾向评分匹配: 使用算法更好地配对处理组和对照组。
      • 特征选择: 识别影响处理结果的关键变量并调整。
      • 鲁棒性检验: 应用机器学习方法评估传统DID结果的有效性。
Financial Machine Learning · Lecture 8

DID:结论与参考文献

  • 总结:

    • DID 是在缺乏随机化情况下估计因果效应的有力工具,特别在经济和金融领域非常有用。
  • 参考文献:

    1. Ashenfelter, O. (1978). "确定参与收入保障计划的参与情况。"
    2. Card, D. (1990). "Mariel船潮对迈阿密劳动市场的影响。"
    3. Goodman-Bacon, A. (2018). "具有处理时机变化的差分中的差分。"
    4. Doudchenko, N., & Imbens, G. W. (2016). "平衡、回归与随机化推断。"
Financial Machine Learning · Lecture 8

倾向评分匹配(PSM)方法论:介绍

  • 定义:

    • 倾向评分匹配(PSM)是一种统计技术,通过考虑预测接受治疗的协变量来估计治疗或干预的效果。
  • 目标:

    • 通过匹配具有类似特征的处理组和对照单位来减少选择偏差。
  • 适用问题:

    • 政策评估、医疗保健的处理效应、金融和社会科学。
Financial Machine Learning · Lecture 8

倾向评分匹配(PSM):基本概念

  • 模型 / 公式:

    • 倾向评分:
      • 其中 表示接受处理, 包括协变量。
  • 假设:

    • 无关性假设: 在给定观察到的协变量的情况下,潜在结果与处理分配是独立的。
    • 共同支持: 处理组和对照组之间的协变量分布存在重叠。
  • 因果推断分析:

    • PSM 旨在创建一种准实验条件,使在不进行随机化的情况下能够通过平衡协变量来估计因果效应。
Financial Machine Learning · Lecture 8

PSM:关键组件

  • 处理组:

    • 接受干预或处理的个体。
  • 对照组:

    • 不接受干预的个体,用于比较。
  • 倾向评分:

    • 在给定一组观察到的协变量的情况下,接受处理的概率。
Financial Machine Learning · Lecture 8

PSM:示例

  • 背景:

    • 评估金融素养培训对储蓄行为的影响。
  • 数据:

    • 处理组: 完成培训的个体。
    • 对照组: 没有参与的相似个体。
  • 过程:

    • 根据倾向评分匹配参与者,以估计培训对储蓄率的影响。
Financial Machine Learning · Lecture 8

PSM:实施步骤

  1. 使用逻辑回归模型(或其他方法)估计倾向评分,以预测基于协变量的处理分配。
  2. 根据倾向评分匹配处理单位和对照单位(例如,最近邻匹配、卡尺匹配)。
  3. 评估匹配后的协变量平衡,以确保两组之间的相似性。
  4. 使用匹配后的样本估计处理效应。
Financial Machine Learning · Lecture 8

PSM:局限性与考虑

  • 假设有效性:

    • 该方法在很大程度上依赖于无关性假设;未观察到的混杂因素可能会偏差结果。
  • 匹配质量:

    • 匹配不良可能导致偏差控制不充分;检查平衡至关重要。
  • 数据质量:

    • 需要拥有足够协变量的丰富数据集,以确保有效估计。
Financial Machine Learning · Lecture 8

PSM:机器学习的应用

  • 最新文献:
    • 机器学习技术正日益被集成到PSM中,以增强模型估计:
      • 倾向评分估计: 使用先进算法(例如,随机森林、梯度提升)提高倾向评分估计的准确性。
      • 匹配过程自动化: 机器学习算法可以更有效地自动匹配处理组和对照组,优于传统方法。
      • 鲁棒性和泛化: 利用机器学习的预测能力评估不同人群中的处理效应。
Financial Machine Learning · Lecture 8

PSM:结论与参考文献

  • 总结:

    • PSM 是一种在观察研究中估计因果效应的宝贵工具,特别在金融和经济学中非常有用。
  • 参考文献:

    1. Rosenbaum, P. R., & Rubin, D. B. (1983). "倾向评分在因果效应的观察研究中的核心作用。"
    2. Imbens, G. W. (2004). "在外生性下的平均处理效应的非参数估计:回顾。"
    3. Lechner, M. (2002). "劳动市场政策评估的一些实际问题。"
    4. Leuven, E., & Sianesi, B. (2003). "PSMATCH2:进行完整的Mahalanobis和遗传匹配的Stata模块。"
Financial Machine Learning · Lecture 8

回归不连续设计(RDD)方法论:介绍

  • 定义:

    • 回归不连续设计(RDD)是一种准实验的前测-后测设计,利用截止点或阈值分配处理,从而允许对干预效果进行因果推断。
  • 目标:

    • 通过利用基于观察变量的处理分配不连续性来估计因果效应。
  • 适用问题:

    • 政策评估、教育和健康项目评估、金融干预等。
Financial Machine Learning · Lecture 8

RDD:基本概念

  • 模型 / 公式:

    • 基本的RDD模型可以表示为:

      • 其中 是结果变量, 是处理是否应用的指标, 捕捉截止点附近协变量的函数形式。
  • 假设:

    • 连续性假设: 潜在结果在截止点处是连续的;没有其他突变除处理效应外。
    • 局部随机化: 截止点附近的单位被认为是在处理组和对照组之间随机分配的。
  • 因果推断分析:

    • RDD 允许通过比较截止点上下的结果来估计因果效应,假设所有其他因素保持不变。
Financial Machine Learning · Lecture 8

RDD:关键组件

  • 运行变量:

    • 确定处理分配的连续变量,基于指定的截止点。
  • 截止点:

    • 处理变化的阈值(例如,收入水平、考试分数)。
  • 处理组:

    • 刚好在截止点上方的单位,接受处理。
  • 控制组:

    • 刚好在截止点下方的单位,不接受处理。
Financial Machine Learning · Lecture 8

RDD:示例

  • 背景:

    • 评估最低工资提高对就业水平的影响。
  • 数据:

    • 运行变量: 企业的平均工资水平。
    • 截止点: 最低工资立法阈值。
  • 观察:

    • 比较最低工资阈值上下的企业就业趋势,以估计政策的影响。
Financial Machine Learning · Lecture 8

RDD:实施步骤

  1. 确定用于处理分配的运行变量和截止点。
  2. 收集截止点附近结果变量和协变量的数据。
  3. 进行图形分析,以可视化截止点的断裂。
  4. 使用局部多项式回归或参数方法估计因果效应。
  5. 通过敏感性分析和不同带宽检验结果的鲁棒性。
Financial Machine Learning · Lecture 8

RDD:局限性与考虑

  • 假设有效性:

    • 结果仅在假设没有其他因素在截止点处发生变化的情况下有效。
  • 有限的外推性:

    • 结果可能仅适用于截断附近的单位;外部有效性可能有限。
  • 数据质量:

    • 需要在截止点周围有精确测量的大数据集,以确保可靠估计。
Financial Machine Learning · Lecture 8

RDD:机器学习的应用

  • 最新文献:
    • 最近的研究开始将机器学习技术集成到RDD中,以增强因果推断:
      • 灵活的函数形式: 机器学习算法(例如,随机森林、神经网络)能够建模截止点附近的非线性关系。
      • 自动带宽选择: 使用机器学习方法确定最优带宽以提高估计准确性。
      • 鲁棒性检验: 机器学习方法可以通过比较不同模型的预测来帮助验证RDD的发现。
Financial Machine Learning · Lecture 8

RDD:结论与参考文献

  • 总结:

    • RDD 是一种在随机分配不可行的情况下估计因果效应的强大方法,特别在经济学和金融领域相关。
  • 参考文献:

    1. Imbens, G. W., & Lemieux, T. (2008). "回归不连续设计:实践指南。"
    2. Lee, D. S., & Lemieux, T. (2010). "经济学中的回归不连续设计。"
    3. Cattaneo, M. D., Idrobo, N., & Titiunik, R. (2019). "回归不连续设计的实用介绍。"
    4. Gelman, A., & Imbens, G. W. (2019). "为什么在回归不连续设计中不应使用高阶多项式。"
Financial Machine Learning · Lecture 8

第三部分 · 选择后的推断

  • 重要性:在高维数据中的模型选择和稀疏性。
  • 重点
    • 选择后的推断
    • Lasso估计器作为变量选择工具
    • 双重选择方法
  • 相关章节
    • 第5章:机器学习后的推断
    • 第6章:工具变量模型
    • 第7章:进一步发展
Financial Machine Learning · Lecture 8

选择后的推断问题

  • 两步推断
    • 首先,选择一个模型。
    • 然后,将结果报告为真实的。
  • 挑战:忽视选择步骤可能导致误导性结果。
  • 背景:基于Leeb和Pötscher(2005)的工作。
Financial Machine Learning · Lecture 8

模型

  • 假设:稀疏高斯线性模型

    • 是非奇异的。
  • 模型
    • : 稀疏(R)与不受限(U)
Financial Machine Learning · Lecture 8

一致的模型选择

  • 对于的包含决策规则:

  • 渐近性质(引理4.1):
    • 模型选择的一致性当
Financial Machine Learning · Lecture 8

选择后估计量的分布

  • 选择后估计量表示为:

  • 分布结果表明,即使在选择后,分布也偏离高斯分布。
Financial Machine Learning · Lecture 8

高维、稀疏性与Lasso

  • Lasso估计器 定义为:

    • 在拟合(均方误差)与稀疏性(L1范数)之间取得平衡。
  • 假设:稀疏高斯线性模型,的稀疏性约束。
Financial Machine Learning · Lecture 8

Lasso的理论元素

定理:Lasso的一致性

  • Lasso估计量在中是一致的:

  • 准则强度和特征值条件的含义。
Financial Machine Learning · Lecture 8

正则化偏差

  • 正则化偏差:由于包含/去除变量导致的偏差,进而导致错误的推断。
  • 双重目标的风险:(选择变量和准确估计)。
Financial Machine Learning · Lecture 8

双重选择方法

  1. 在处理上选择:使用Lasso对进行回归。
  2. 在结果上选择:使用Lasso对进行回归。
  3. 最终估计:对选定的进行OLS回归。
  • 结果
    • 提供对处理效应的有效推断。
Financial Machine Learning · Lecture 8

实证应用:教育对工资的影响

  • 数据:法国2017-2019年的Enquête Emploi,共162,254个观察值。
  • 建模:用教育水平和其他控制变量解释月薪的对数。
  • 重要性
    • 双重选择方法提高了处理效应估计的精度。
Financial Machine Learning · Lecture 8

总结

  • 关键概念
    • 选择后的推断、Lasso估计器、正则化偏差、双重选择方法。
  • 建议
    • 理解在不确定性下选择变量和估计的细微差别。
Financial Machine Learning · Lecture 8

其他参考文献

  • Tibshirani (1994) - Lasso回归。
  • Belloni et al. (2014) - 易于接触的计量经济学参考资料。
  • R包:hdm用于实际应用。
Financial Machine Learning · Lecture 8

第四部分 · 推广与方法论

  • 重点:推理在计量经济学建模中的重要性。
  • 目标
    • 了解评估模型性能的方法论。
    • 探索过拟合及其影响。
  • 内容
    • 统计学习理论
    • 交叉验证技术
    • 正则化方法
Financial Machine Learning · Lecture 8

在计量经济学中的推广

  • 定义:推广指的是模型在未见数据上的良好表现能力。
  • 关键概念:偏差-方差权衡影响预测准确性:
    • 偏差:由于近似复杂真实情况而产生的误差。
    • 方差:由于模型对训练集波动敏感而产生的误差。
Financial Machine Learning · Lecture 8

统计学习理论

  • 框架:分析学习算法的推广能力与模型复杂性之间的关系。
  • 风险函数

    • : 损失函数。
    • : 期望风险(平均损失)。
Financial Machine Learning · Lecture 8

模型复杂性

  • 定义:复杂性衡量模型拟合数据的能力。
  • 类型
    • 灵活模型:可以拟合多种模式(例如,高次多项式)。
    • 刚性模型:提供较少的方差(例如,线性模型)。
  • 含义:复杂性增加可能导致过拟合。
Financial Machine Learning · Lecture 8

过拟合

  • 定义:当模型捕捉到训练数据中的噪音而非潜在模式时发生。
  • 指标
    • 训练集上的高准确率与验证/测试集上的低准确率。
  • 后果:导致推广性差和预测性能不佳。
Financial Machine Learning · Lecture 8

交叉验证技术

  • 目的:评估模型性能并避免过拟合。
  • 方法
    • K折交叉验证:将数据分为 个子集;在 个上训练并在剩余上验证。
    • 保留法:将数据集拆分为训练集和测试集。
  • 目标:确保模型对新数据的良好推广。
Financial Machine Learning · Lecture 8

正则化技术

  • 目的:通过增加复杂度的惩罚来对抗过拟合。
  • 常用方法
    • Lasso回归

    • Ridge回归

  • 效果:降低模型复杂性并增强预测稳定性。
Financial Machine Learning · Lecture 8

模型选择标准

  • 常用标准
    • AIC(赤池信息量准则)

    • BIC(贝叶斯信息量准则)

  • 用途:基于拟合优度与模型复杂性之间的权衡选择模型。
Financial Machine Learning · Lecture 8

结论

  • 关键要点
    • 强调推广对模型有效性至关重要。
    • 理解偏差与方差的平衡有助于提高性能。
    • 正则化和交叉验证是防止过拟合的强大工具。
Financial Machine Learning · Lecture 8

进一步阅读

  • Flach, P. A. (2015): "机器学习:理解数据的算法艺术与科学"。
  • Hastie, T., Tibshirani, R., & Friedman, J. (2009): "统计学习的要素"。
  • Bishop, C. M. (2006): "模式识别与机器学习"。
Financial Machine Learning · Lecture 8

第五部分 · 高维与内生性

  • 重点:解决计量经济学中的内生性和高维环境。
  • 关键主题
    • 内生性的来源
    • 工具变量(IV)
    • 双重/导向机器学习技术
  • 目标:在复杂模型中开发实用的推断方法。
Financial Machine Learning · Lecture 8

内生性简介

  • 定义:当自变量与回归模型中的误差项相关时发生内生性。
  • 后果
    • 估计值存在偏差且不一致。
    • 推断结果误导。
Financial Machine Learning · Lecture 8

内生性的来源

  1. 遗漏变量偏差
    • 当模型中遗漏了一个相关变量时。
  2. 测量误差
    • 变量值的误差导致估计偏差。
  3. 同时性
    • 因变量与自变量之间的相互因果关系。
Financial Machine Learning · Lecture 8

工具变量(IV)

  • 目的:当内生性存在时提供有效的估计。
  • 条件
    1. 相关性:工具变量必须与内生变量相关。
    2. 外生性:工具变量仅通过内生变量影响因变量。
Financial Machine Learning · Lecture 8

两阶段最小二乘法(2SLS)方法

  1. 第一阶段:将内生变量回归于工具变量及其他控制变量。

  2. 第二阶段:用预测值替代内生变量并估计结果。

Financial Machine Learning · Lecture 8

工具变量的局限性

  • 弱工具变量:与内生变量相关性弱的工具变量可能导致不可靠的估计。
  • 过度识别:使用比必要更多的工具变量可能会使识别变得复杂。
Financial Machine Learning · Lecture 8

双重/去偏机器学习(DML)

  • 目的:解决高维环境中的内生性问题。
  • 关键特征
    • 将机器学习与计量经济学技术结合。
    • 在处理偏差的同时提高估计精度。
Financial Machine Learning · Lecture 8

DML框架

  1. 建模:使用机器学习算法预测治疗和结果。
  2. 去偏:调整因选择程序引入的偏差。
Financial Machine Learning · Lecture 8

DML的理论基础

  • 假设
    • 误差项之间的横截面独立性。
    • 观测值的稳定处理效应。
  • 估计

Financial Machine Learning · Lecture 8

实际应用

  • 示例:估计教育对工资的因果效应。
  • 数据:捕捉教育、经验和工资的纵向数据。
  • 分析步骤
    1. 确定内生变量。
    2. 根据需要应用2SLS或DML。
Financial Machine Learning · Lecture 8

结论

  • 总结
    • 高维数据需要强大的技术以应对内生性问题。
    • DML作为因果推断的有效方法。
    • 强调模型选择和验证的重要性。
Financial Machine Learning · Lecture 8

进一步阅读

  • 书目
    • Angrist, J. D., & Pischke, J. S. (2009). "大多数无害的计量经济学"。
    • Belloni, A., Chen, D., 等(2014)。"高维稀疏计量经济模型的推断"。
    • Imbens, G. W., & Rubin, D. B. (2015). "统计、社会和生物医学科学中的因果推断"。
Financial Machine Learning · Lecture 8

第六部分 · 进一步研究

  • 重点:计量经济学和机器学习的高级主题。
  • 目标
    • 探索最先进的方法及其应用。
    • 讨论局限性和未来的研究方向。
Financial Machine Learning · Lecture 8

高级计量经济学技术

  • 机器学习集成:利用随机森林、提升和神经网络等机器学习方法。
  • 模型灵活性:采用灵活的建模方法以捕捉复杂关系。
Financial Machine Learning · Lecture 8

正则化技术

  • 目的:防止过拟合并增强预测性能。

  • 常用算法

    • Lasso回归

    • Ridge回归

Financial Machine Learning · Lecture 8

模型评估指标

  • 均方根误差(RMSE)

  • 混淆矩阵:评估分类性能。
Financial Machine Learning · Lecture 8

因果推断框架

  • 反事实框架:利用潜在结果建立因果关系。
  • 图形模型
    • 有向无环图(DAG)用于说明假设和依赖关系。
Financial Machine Learning · Lecture 8

局限性和挑战

  • 数据限制:数据的质量和数量可能限制模型性能。
  • 可解释性:在模型复杂性与可解释性需求之间取得平衡。
Financial Machine Learning · Lecture 8

未来方向

  • 研究重点:解决数据和方法论中的复杂性。
  • 合作:跨学科的方法丰富计量经济学方法。
Financial Machine Learning · Lecture 8

结论

  • 总结:本章丰富了对高级计量经济学技术及其应用的理解。
  • 影响:为未来研究和方法开发提供了基础。
Financial Machine Learning · Lecture 8

第七部分 · 对异质效应的推断

  • 重点:理解和估计异质处理效应。
  • 关键主题
    • 异质效应的方法
    • 对政策和治疗个性化的影响
Financial Machine Learning · Lecture 8

理解异质性

  • 定义:不同个体或群体之间的处理效应差异。
  • 重要性:承认单一政策可能对每个人都无效。
Financial Machine Learning · Lecture 8

估计异质效应的方法

  • 子组分析:对数据进行分层,以观察特定组内的效应。
  • 分位数回归:检查不同分位数的结果分布的效应。
Financial Machine Learning · Lecture 8

统计框架

  • 模型规格

    其中:
    • : 结果
    • : 处理指示器
    • : 协变量
Financial Machine Learning · Lecture 8

识别异质效应

  • 交互作用:纳入交互项以捕捉效应的变化:

  • 随机效应模型:包括随机截距/斜率以考虑个体差异。
Financial Machine Learning · Lecture 8

机器学习的应用

  • 灵活模型:采用机器学习模型来识别和估计处理异质性。
  • 特征选择:利用高维协变量提高预测的准确性。
Financial Machine Learning · Lecture 8

政策影响

  • 个性化治疗:基于估计的异质效应量身定制干预措施。
  • 评估:定期评估,以衡量不同人口统计特征的有效性。
Financial Machine Learning · Lecture 8

结论

  • 总结:理解异质性对有效政策制定至关重要。
  • 未来研究:探索新方法有效地估计和解释异质效应。
Financial Machine Learning · Lecture 8

第八部分 · 最优政策学习

  • 重点:经济计量学中的最优政策学习原则。
  • 关键目标
    • 开发政策评估和优化的方法。
    • 建立有效的处理分配策略。
Financial Machine Learning · Lecture 8

最优政策学习简介

  • 概念:基于数据学习最大化某个目标函数的政策。
  • 应用:个性化的处理分配、资源分配。
  • 挑战:在决策中平衡探索与利用。
Financial Machine Learning · Lecture 8

政策学习框架

  1. 假设

    • 环境通过政策影响结果。
    • 历史数据对学习有效政策至关重要。
  2. 目标:最大化期望效用或结果,定义为:

Financial Machine Learning · Lecture 8

处理分配策略

  • 随机对照试验(RCTs):评估政策有效性的基准。
  • 自适应治疗:根据观察到的数据随时间修改治疗。
  • 政策评估:使用估计技术评估各种政策的有效性。
Financial Machine Learning · Lecture 8

政策效应的估计

  • 关键指标

    • 平均处理效应(ATE):

  • 条件ATE

Financial Machine Learning · Lecture 8

探索与利用

  • 探索:收集更多信息以改善未来政策。
  • 利用:利用现有知识以优化即时结果。
  • 平衡:政策学习算法必须有效管理探索与利用,以改善结果。
Financial Machine Learning · Lecture 8

政策设计的影响

  • 自适应政策:随着更多信息的可用而量身定制。
  • 鲁棒性:政策必须对模型规格具有弹性。
  • 评估:实施定期评估,根据新数据优化政策。
Financial Machine Learning · Lecture 8

结论

  • 总结:最优政策学习对有效的计量经济建模和决策至关重要。
  • 未来方向:继续将计量经济学与机器学习技术结合,以增强政策学习。
Financial Machine Learning · Lecture 8

进一步阅读

  • 相关文献
    • "统计、社会和生物医学科学中的因果推断" by Imbens and Rubin.
    • "强化学习:导论" by Sutton and Barto.
Financial Machine Learning · Lecture 8

Part 9 · Literatures

Financial Machine Learning · Lecture 8

Literature:Inference on Treatment Effects after Selection among High-Dimensional Controls

Financial Machine Learning · Lecture 8

Inference on Treatment Effects after Selection among High-Dimensional Controls

  • 研究内容:本文提出了一种新颖的方法,用于在控制变量高维存在的情况下估计处理效应,特别是在控制数超过样本量时。作者提出了后双重选择(post-double-selection)方法,该方法进行两轮变量选择,随后在部分线性模型中进行处理效应估计:

Financial Machine Learning · Lecture 8
  • 主要思想和贡献

    • 提议的方法通过放宽对变量稀疏性的假设,允许识别相关控制变量。
    • 它提供了统一有效的推断,意味着所获得的置信区间在广泛的模型类中都是鲁棒的。
    • 作者通过重新分析堕胎对犯罪率的影响,说明了这种方法的有效性,展示了他们的方法可能得出与以前较不严格模型不同的结论。
  • 对实证金融的意义

    • 该方法增强了实证金融研究,允许在不导致过拟合的情况下进行更灵活的模型规格。
    • 它强调了严格选择变量的重要性,解决了与遗漏变量误差相关的潜在偏差。
    • 研究结果促使研究者在估计处理效应时使用鲁棒的自适应技术,从而有助于更准确的经济模型和政策分析。
Financial Machine Learning · Lecture 8

Literature:Propensity score estimation with boosted regression

Financial Machine Learning · Lecture 8

Propensity Score Estimation with Boosted Regression

  • 研究内容:本文解决了在观察性研究中估计处理效应时面临的挑战,尤其是当参与者在治疗前的特征上差异显著时。传统的方法,如逻辑回归,可能在面对高维协变量时表现不足。作者提出使用**广义提升模型(GBM)**来估计倾向评分,从而增强捕捉治疗分配与协变量之间复杂关系的能力。
Financial Machine Learning · Lecture 8
  • 主要思想和贡献
    • 提升技术:本文展示了提升技术能够有效建模大量协变量之间的非线性关系和交互作用,从而提供稳健的倾向评分估计。
    • 案例研究应用:使用青少年药物滥用治疗项目的数据对该方法进行了说明,结果表明,与传统的逻辑方法相比,GBM可能显著改变对治疗效果的感知。
Financial Machine Learning · Lecture 8
  • 偏差减少:通过采用GBM,作者能够减少隐藏偏差并改善治疗组与对照组之间的协变量平衡,从而为平均处理效应的估计提供了更好的支持。

  • 对实证金融的意义

    • 增强估计:使用GBM为实证金融研究人员提供了一种强有力的工具,以调整混杂变量,尤其是在涉及复杂数据集的研究中,传统方法往往失败。
    • 适应非线性:识别和建模金融数据中的非线性关系有助于改善因果推断,最终支持政策影响和经济研究中治疗效果的评估。
    • 因果推断的影响:研究结果强调了在观察性研究中利用先进统计技术(如提升)以减轻偏差的必要性,为未来的实证研究方法设立了先例。
Financial Machine Learning · Lecture 8

Literature:Recursive Partitioning for Heterogeneous Causal Effects

Financial Machine Learning · Lecture 8

Recursive Partitioning for Heterogeneous Causal Effects

  • 研究内容:本文介绍了一种使用递归划分技术识别异质处理效应的新方法。作者开发了一个框架,使研究人员能够根据观察到的协变量揭示不同子群体间处理效应的变化。这种方法在期望不同组别间的处理效应显著不同的情况下尤其相关。
Financial Machine Learning · Lecture 8
  • 主要思想和贡献
    • 方法论:该研究展示了如何将递归划分有效地应用于因果推断,揭示不同协变量模式如何影响治疗有效性。这通过因果树的概念进行形式化,因果树创建了一个反映处理效应变化的树状结构。
    • 实施与结果:该方法在合成数据和真实数据上的测试结果显示,其相对于传统模型(如线性回归和治疗分配失衡)表现稳健。
Financial Machine Learning · Lecture 8
  • 建模的灵活性:通过适应非线性交互作用并通过树状结构实现易于解释,该方法增强了对因果关系的理解。

  • 对实证金融的意义

    • 精准政策干预:这种方法能够通过识别哪些子群体从干预中受益最多,改善金融政策和项目的设计,从而促进精准策略的制定。
    • 增强的预测性能:递归划分作为实证金融中的强大工具,使得对复杂关系的建模变得可能,而传统方法可能会失败。
    • 未来研究的指导:研究结果鼓励采纳机器学习技术进行因果推断,建议实证金融研究向更灵活、数据驱动的方法转变。
Financial Machine Learning · Lecture 8

Literature:Double/debiased machine learning for treatment and structural parameters

Financial Machine Learning · Lecture 8

Double Debiased Machine Learning for Treatment and Structural Parameters

  • 研究内容:本文介绍了一种**双重去偏机器学习(DML)**框架,旨在改善在复杂计量经济模型中对处理效应和结构参数的估计。它解决了在使用机器学习方法估计处理效应时出现的偏差问题,尤其是在高维环境中,传统推断方法可能不够有效。DML框架将正则化技术与去偏策略结合,增强统计效率,同时不妨碍结果的可解释性。
Financial Machine Learning · Lecture 8
  • 主要思想和贡献
    • DML框架:本文概述了DML程序,包括两个阶段:首先,使用机器学习技术估计干扰参数;其次,以去偏方式使用这些估计量以实现一致的处理效应估计。DML的理论基础确保了即使在高维环境中也能进行有效推断。
Financial Machine Learning · Lecture 8
  • 实证验证:作者通过模拟和真实数据示例展示了其方法的应用,证明其相较于传统方法显著提高了性能。

  • 更广泛的适用性:该方法具有广泛的可推广性,适用于各种计量经济学设置,使其适合于金融及其他领域的广泛实证研究场景。

  • 对实证金融的意义

    • 改进估计:DML方法使金融研究者能够在复杂的数据集中获得更可靠的处理效应和结构参数估计,尤其在特征变量较多的情况下。
    • 鲁棒性:通过有效地解决偏差问题,DML提高了从观察性研究中得出的因果推断的鲁棒性,从而带来了更好的政策含义和决策效果。
    • 研究设计指导:研究结果促进了将先进的机器学习方法融入因果推断中,鼓励实证金融学者重新思考传统的方法框架。
Financial Machine Learning · Lecture 8

Literature:Robust Nonparametric Confidence Intervals for Regression‐Discontinuity Designs

Financial Machine Learning · Lecture 8

Robust Nonparametric Confidence Intervals for Regression-Discontinuity Designs

  • 研究内容:本文重点提升回归不连续性(RD)设计中的统计推断,这是政策评估和经济学中广泛使用的因果推断方法。作者开发了稳健的非参数置信区间,以考虑在截止点可能存在的非参数误差,使研究人员能够在该不连续点对处理效应做出可信的推断。

  • 主要思想和贡献

    • 稳健方法:所提出的方法通过采用非参数技术改进传统的参数方法,保持对模型误设的稳健性。这在处理效应在截止点及附近显著变化的情况下尤为相关。
    • 置信区间构建:作者推导出在较弱条件下有效的新置信区间,并采用数据驱动的带宽选择方法,确保基于底层数据分布的最佳区间校准。
Financial Machine Learning · Lecture 8
  • 模拟研究:广泛的模拟和应用展示了所提方法相较于标准方法的优势,表明在RD设计中估计处理效应时的准确性和可靠性更高。

对实证金融的意义

  • 增强因果推断:研究结果使金融研究人员能够更准确地估计表现出不连续性的干预和政策的影响,从而做出更明智的决策。
  • 适用性:这一稳健框架可以应用于多种实证情境,包括财政政策、教育项目和健康干预的评估,提高了跨学科因果推断的质量。
  • 方法论贡献:鼓励在因果推断中采用稳健的非参数方法,突出了模型规格灵活性的重要性,最终有助于在金融和经济学中得出更可靠的实证结果。
Financial Machine Learning · Lecture 8

Literature:Policy Learning with Observational Data

Financial Machine Learning · Lecture 8

Policy Learning with Observational Data

  • 研究内容:本文探讨了从观察性数据中学习最优政策的普遍挑战和方法论。它开发了一个综合框架,将因果推断与机器学习技术整合,以便在非实验环境中有效地评估政策。该方法承认观察性数据中固有的选择偏差,同时旨在得出稳健的政策建议。

  • 主要思想和贡献

    • 框架开发:作者提出了一种结合政策学习反事实预测的新算法,从而能够识别最佳治疗策略。该框架包含一个两步过程:估计治疗的因果效应,并根据这些估计完善政策建议。
    • 解决选择偏差:通过利用因果推断和机器学习的技术,本文展示了如何减轻通常会扭曲处理效应估计的偏差。
Financial Machine Learning · Lecture 8
  • 实证应用:通过多种实证实例,作者验证了提议方法在现实场景中的有效性,显示出与传统方法相比政策结果的改善。

对实证金融的意义

  • 实际影响:研究结果强调了利用观察性数据改善金融政策制定的潜力,特别是在随机对照试验不可行的情况下。
  • 方法学进步:这项研究通过将机器学习与因果推断相结合,贡献了一种方法学上的进步,鼓励实证金融研究人员采用更为细致的分析技术。
  • 提高决策能力:从观察性数据中得出可行见解的能力增强了金融决策过程,使政策的制定不仅有效,而且能够应对现实世界的复杂性。
Financial Machine Learning · Lecture 8

Literature:GANITE Estimation of Individualized Treatment Effects using Generative Adversarial Nets

Financial Machine Learning · Lecture 8

GANITE: Estimation of Individualized Treatment Effects using Generative Adversarial Nets

  • 研究内容:本文介绍了GANITE,一种利用生成对抗网络(GANs)从观察性数据中估计个体化处理效应(ITE)的新框架。作者旨在解决传统ITE估计方法中面临的挑战,特别是在高维协变量空间中,常规技术往往表现不佳或导致过度拟合。

  • 主要思想和贡献

    • 生成方法:GANITE利用GAN的强大功能生成反事实结果,从而能够更准确地估计每个个体的处理效应。该框架包括一个建模治疗分配的生成器和一个助于评估反事实预测质量的对抗判别器。
    • 改进的ITE估计:通过形式化治疗分配、协变量和结果之间的关系,GANITE增强了与传统基于回归的方法相比,ITE估计的精确度。
Financial Machine Learning · Lecture 8
  • 实证验证:作者通过广泛的模拟和真实数据应用验证了他们的方法,展示出在估计个体化处理响应方面,相较于现有方法显著改进的效果。

  • 对实证金融的意义

    • 个性化决策:GANITE对ITE的稳健估计使金融分析师和政策制定者能够根据个体特征量身定制干预措施,从而提高金融产品和服务的有效性。
    • 方法论进展:将GAN与因果推断结合代表了一次方法上的飞跃,鼓励研究者在实证金融研究中采用先进的机器学习技术。
    • 深刻的政策制定:通过提供准确的处理效应估计,GANITE帮助制定响应细微经济行为和状况的数据驱动政策,促进更有效的金融治理。
Financial Machine Learning · Lecture 8