Week 5 实证资产定价

Empirical Asset Pricing: Methods, Models, and Evidence

课程概览

讲授部分(2.5-3小时)

  • Module 1: 基本框架与核心逻辑(40分钟)
    • SDF、线性因子模型、核心变量设定
  • Module 2: 五大经验方法(50分钟)
    • 时间序列/FM/排序/特征回归/SDF-GMM
  • Module 3: "显著"的三重含义与检验框架(40分钟)
    • 显著 / 显著 / 显著、实证可靠性三要素
  • Module 4: 风险 vs 错误定价的判别框架(30分钟)
    • 四层判别框架、机器学习时代的新范式

实践部分(1-1.5小时)

  • 分组项目制(3-4人/组)
  • 7个可选研究主题
  • 实践操作与答疑
  • 分组汇报与讨论

学习成果

知识维度

  • 随机贴现因子(SDF)、线性因子模型的核心思想
  • 五大主流方法及其适用场景
  • "显著"的三种含义及相应检验框架
  • 风险补偿与错误定价的判别逻辑

技能维度

  • 独立进行完整的因子模型实证研究
  • 正确选择和应用五大方法之一
  • 做出稳健的统计推断
  • 解释实证结果,判断异常收益的经济成因

科学素养

  • 对数据发现的警惕心和批判精神
  • 学术严谨性和规范意识

课程结构

graph TD L1["实证资产定价专题"] --> L2["讲授部分"] L1 --> L3["实践部分"] L2 --> M1["Module 1
基本框架与核心逻辑"] L2 --> M2["Module 2
五大经验方法"] L2 --> M3["Module 3
'显著'的三重含义"] L2 --> M4["Module 4
风险vs错误定价判别"] L3 --> P1["分组选题与分工"] L3 --> P2["实践操作与答疑"] L3 --> P3["分组汇报与讨论"]

Module 1

基本框架与核心逻辑

  • 导入问题:为什么不同资产的平均收益不同?
  • 资产定价的基本逻辑:SDF与线性因子模型
  • 核心变量与基本设定
  • 预期收益的两个层面:时间序列与横截面
  • 小结与思考

1.1 导入问题:为什么资产收益不同?

核心问题链:

为什么不同资产的平均收益不同?
         ↓
是对系统性风险的补偿,还是市场错误定价?
         ↓ 
如何用理论和数据区分这两种可能?
         ↓ 
这涉及模型设定、估计方法和检验框架三个环节

案例:小盘股溢价

假设发现"小盘股长期平均收益 > 大盘股"。三种可能的解释:

  1. 风险补偿解释:小盘股面临更高的系统性风险(如流动性风险、衰退期表现差),投资者要求风险补偿
  2. 错误定价解释:市场参与者因信息不完全、交易成本、行为偏差等原因,导致小盘股被系统性低估
  3. 数据巧合或其他机制:样本选择偏差、测度误差或遗漏了其他因素

关键:这三种解释无法仅通过统计显著性来区分,需要多层面的证据

1.2 资产定价的基本逻辑

定理1:无套利下的 SDF 约束

在无套利市场中,存在一个随机贴现因子(Stochastic Discount Factor),使得任何资产 的(以当前价格为基准的)毛收益率(gross return)

满足:

同时采用无风险资产的 SDF 归一化:

超额收益形式:
令无风险毛收益率为 ,并定义超额收益

则有

经济意义:
• 资产值多少钱(资产的期望回报与价格),不只是由“这只股票波动有多大”决定;更关键的是它的回报在贴现权重下的变化方式。
• 因而应关注 的相关性/协方差结构,而不是只看波动幅度。

贴现因子越大对应的状态通常意味着“边际效用更高/更不利”,因此在这些状态下资产是“涨”还是“跌”会直接影响其定价。

SDF 约束的直观理解

例子: 两只风险资产 A 和 B,总波动率(方差结构)相同,但它们在好/坏状态下与 的关系不同。

情景 资产A 资产B
经济繁荣 收益高 收益低
经济衰退 暴跌 反而强势(收益上升)
关系 ↑时收益↓ ↑时收益↑
期望收益要求 高(需要风险补偿) 低(类似保险)

启示: 总波动率(或方差结构)相同的资产,期望收益可能完全不同;关键在于资产在 贴现权重较高的“坏状态/不利状态” 下的表现,以及其与 的协同变化方式。

风险溢价与 SDF 的协方差关系

并结合 ,可得

因此:若资产收益在 较大(坏/不利)时更差(即与 正相关),则其期望超额收益更高;若在坏状态反而表现更好(对冲坏状态),则期望超额收益更低。

线性因子模型

定理2:线性因子模型与期望收益关系

在实证中,通常假设SDF可以写成线性形式:

其中为"因子"(如市场收益、规模溢价等)。

代入SDF约束,可得:

其中:

  • :资产对因子的暴露(敏感度)
  • :因子的风险价格(risk premium)

某资产的期望超额收益 = 其对各因子暴露 × 对应因子的风险价格

1.3 核心变量与基本设定

设定1:时间序列因子模型

参数 含义 理论期望
资产期的超额收益(相对无风险利率)
因子向量(如市场超额收益、SMB等)
暴露向量,资产对各因子的敏感度 任意
定价误差(alpha) 0(模型正确定价)
模型残差 均值为0

横截面定价关系

设定2:横截面定价关系

对于某一时期,资产横截面上的平均收益应满足:

其中为因子风险价格。在有效模型下,定价误差应不显著。

关键连接:

  • 时间序列模型:估计(因子暴露)
  • 横截面模型:估计(风险价格)
  • 两者的桥梁:若模型正确,

1.4 预期收益的两个层面

困惑: 实证中既有"时间序列"的因子模型,又有"横截面"的定价关系,两者是什么关系?

理论框架(基于SDF)

期望收益的横截面关系:

实证设定(假设市场是线性因子模型)

时间序列回归:

若模型正确(且因子暴露在样本区间内稳定、风险价格为常数/不时变),时间序列回归估计得到的 (在样本充分时)应收敛到横截面关系中使用的总体 ,同时 应接近0

三个重要的等式关系

  1. 样本内一致性(在参数稳定下):

  2. 模型检验可从两个角度:

    • 时间序列角度:检验每个资产的是否为0(联合GRS检验)
    • 横截面角度:检验因子是否被定价(FM两步法)
  3. 重要结论:

    • 某因子显著 该因子被定价
    • 因子被定价 模型一定正确
    • 在给定测试资产集合上,若(逐个或联合意义下),则支持模型能够正确定价这些资产

1.5 Module 1 小结

要点总结:

  1. 资产定价的理论基础是SDF无套利约束
  2. 线性因子模型是这一约束的经验可操作化
  3. 期望收益差异应由"在坏时刻的表现差"来解释,而非简单的波动率
  4. 实证检验可从时间序列或横截面两个角度展开

思考题:

  • Q1: 为什么某资产的总波动率大,但预期收益反而可能更低?
  • Q2: "某因子显著"和"该因子被定价"有什么区别?
  • Q3: 如果一个模型的检验通过了,是否就意味着该模型一定正确?

Module 2

五大经验方法

  • 方法概览与适用场景
  • 方法1:时间序列因子回归
  • 方法2:Fama-MacBeth两步法
  • 方法3:排序组合
  • 方法4:特征回归
  • 方法5:SDF/GMM方法
  • 机器学习方法(高阶)
  • 总结与方法选择指南

2.1 方法概览与适用场景

方法 核心思想 主要检验对象 适用场景
时间序列回归 对每个资产做时间序列回归,检验 定价误差 多资产定价检验、模型有效性
FM两步法 先估计,再在横截面上检验 风险价格 因子定价检验、因子重要性比较
排序组合 按特征分组,比较高低组平均收益 特征与收益的关系 异常收益发现、新规律识别
特征回归 直接在收益上回归特征 特征的预测能力 特征效应识别、特征定价检验
SDF/GMM 从理论SDF约束出发,用GMM检验矩条件 定价核可行性 理论模型检验、多资产联合定价

2.2 方法1:时间序列因子回归

基本模型:

个测试资产分别回归,得到及其标准误。



步骤1:因子选择与构造

因子 定义 代表论文
市场因子 Sharpe (1964) CAPM
规模因子 Fama & French (1993)
价值因子 Fama & French (1993)
动量因子 Carhart (1997)
盈利因子 Fama & French (2015)
投资因子 Fama & French (2015)

时间序列回归:步骤与检验

步骤2:回归与假设检验

对每个资产,以FF3为例:

检验:

  • 单个资产: vs
  • 联合检验(GRS检验): vs 至少一个

Gibbons, Ross & Shanken (1989) 提出GRS统计量:

其中为残差协方差矩阵,为因子协方差矩阵,为因子均值向量。

标准误的正确选择

时间序列回归残差的特征:

  • 自相关(autocorrelation):月度或日数据中常见
  • 异方差(heteroscedasticity):跨资产或跨时间变化

正确的标准误选择:

标准误类型 处理问题 代表方法
OLS标准误 无(理想情况)
White稳健SE 异方差 White (1980)
Newey-West SE 异方差 + 自相关 Newey & West (1987)
聚类稳健SE 跨截面相关 Cluster-Robust
NW + 聚类 同时处理 双聚类

常见错误: ❌ 使用OLS标准SE(严重低估)→ 导致t值虚高

Newey-West标准误

说明:
使用 Newey & West (1987) 的 HAC(Heteroskedasticity and Autocorrelation Consistent)估计,为时间序列回归(或相应矩条件)的系数/时序统计量提供稳健标准误,用于同时处理异方差与自相关。

滞后阶数选择(经验规则):

  • 一般取
  • 若为月度数据,常用 做敏感性检验
  • 滞后阶数会影响标准误大小与显著性结论

时间序列回归:结果解读


检验结果 解读
多数资产显著 > 0 模型低估了某些资产的收益
多数资产显著 < 0 模型高估了某些资产的收益
大幅偏离0,GRS联合检验显著 模型存在系统性定价误差
,GRS不显著 模型在统计上可接受

2.3 方法2:Fama-MacBeth两步法

问题提出:

时间序列回归检验的是每个资产的。但实证资产定价更关心的是:

某个因子是否在横截面上被市场定价?
暴露于该因子更多的资产,平均收益是否更高?

思想来源: Fama & MacBeth (1973) "Risk, Return, and Equilibrium: Empirical Tests"

FM两步法:具体步骤

第一步:估计因子暴露

的数据,对每个资产做时间序列回归:

得到

第二步:每期横截面回归

的每一期,做横截面回归:

FM两步法:统计推断

第三步:取时间平均

第四步:统计推断

关键提醒: 标准误是时间序列的标准差,而非第二步回归SE的平均

FM两步法:结果解读

情况 含义
显著 > 0 因子被正风险溢价定价,暴露越多风险越高
显著 < 0 因子被负风险溢价定价(类似"保险"资产)
不显著 因子在横截面上不被定价

Errors-in-Variables问题: 第一步估计的存在测度误差,导致第二步的估计有偏。

修正方法:

  • 使用排序组合(非参数方法,无需估计
  • 使用分组(grouping)方法:将个股按分组后再回归
  • 使用Shanken (1992)修正

FM两步法 vs 时间序列回归

方面 时间序列回归 FM两步法
检验对象 (各资产的定价误差) (各因子的风险价格)
核心问题 模型能否定价这些资产? 这些因子是否被定价?
优点 直接、易解释;可检验每个资产 接近理论框架;直接显示风险价格
缺点 不直接显示因子风险价格 标准误计算较复杂
适用场景 多资产定价有效性评估 新因子的风险价格检验

2.4 方法3:排序组合

基本思想:

不做参数回归,而是通过排序分组直接检验某个特征与收益的关系。

步骤:

  1. 在每个月末,按某个特征将股票分成组(通常5或10组)
  2. 持有该组合到下一期,记录收益
  3. 重复计算,得到每组的时间序列收益
  4. 报告各组平均收益与统计显著性

优点:

  • 无参数、直观
  • 自动处理非线性关系
  • 易于展示"规律"的经济大小

常见排序变量与异常收益

特征 定义 代表规律 关键论文
市值 股票总市值 小盘股溢价 Fama & French (1992)
账面市值比 账面价值/市值 价值溢价 Fama & French (1992)
动量 过去12月收益(排除近1月) 动量效应 Jegadeesh & Titman (1993)
盈利能力 ROE、毛利率等 盈利溢价 Fama & French (2015)
投资 资产增长率 投资异常 Fama & French (2015)
应计项 应计利润/总资产 应计异常 Sloan (1996)

排序组合设计

设计1:5分位排序

  1. 每月末,将所有股票按特征从低到高分成5组
  2. 计算第组下月的等权平均收益
  3. 计算多空收益(高减低)
  4. 得到的时间序列
  5. 报告:

设计2:条件排序(conditional sorts)

先按市值分组,再在每组内按B/M分组,得到个组合。

目的: 分离两个特征的独立影响

排序组合:风险调整后的alpha检验

计算出多空组合后,通过因子模型回归检验其alpha:

检验

结果 含义
原始多空收益显著 该特征与平均收益显著相关
调整后alpha仍显著 现有模型(如FF3)不能解释这个收益
调整后alpha不显著 现有模型能解释这个收益规律

排序组合案例:价值因子检验

应用:验证价值因子(HML)是否为实际风险

步骤:

  1. 构造 HML 多空组合(高B/M - 低B/M)
  2. 用CAPM回归:
  3. 结果:α显著,说明HML不能被CAPM解释
  4. 加入HML本身为因子:
    其他资产:
  5. 如果显著,显著,且显著下降 → HML 可能是真实的风险因子

2.5 方法4:特征回归

基本模型:

不引入因子,直接在超额收益上回归某个公司特征:

其中是某个公司特征(如B/M比、ROE等)。

Fama-MacBeth特征回归:

对每个时期,做横截面回归,得到,然后:

检验

特征回归:重要限制

显著的特征效应,并不一定代表该特征是风险因子。

可能的解释:

  1. 风险解释:特征代表某种风险暴露
  2. 错误定价:特征反映市场误定价的对象
  3. 遗漏变量:特征与真正的风险因子相关
  4. 对冲假设:特征能对冲投资者关心的真实风险

特征 vs 因子收益的关键区别:

  • 特征回归:直接用公司特征预测收益,不显式建立β-λ关系
  • 因子模型:构造投资组合作为因子,检验其风险价格

2.6 方法5:SDF/GMM方法

理论基础:

任何资产定价模型都可从SDF约束出发:

这是一组矩条件(moment conditions)。若有个测试资产,就有个约束。

参数化SDF: 假设

GMM估计步骤:

  1. 定义矩函数:
  2. 构造样本矩:
  3. 最小化加权二次型:
  4. J-test:

GMM:J-test解读

J-test结果 含义
不显著(p > 0.05) 模型的矩条件在统计上不被拒绝,模型可接受
显著(p < 0.05) 模型的矩条件被拒绝,说明SDF定价有系统误差

SDF方法优缺点:

方面 说明
优点 更接近理论本体;可同时检验多个资产的定价
局限 假设模型正确;拒绝不一定指出问题所在;过度敏感

Hansen & Jagannathan (1997) "Assessing Specification Errors in Stochastic Discount Factor Models" — 提出了HJ距离作为模型误设定的度量

2.7 机器学习在因子筛选与定价中的应用(高阶)

问题背景:为什么需要机器学习?

传统实证资产定价面临的核心困境:

海量特征问题(Big Data Challenge)
                    ↓
候选因子/特征数量 >> 样本大小(N >> T)
                    ↓
传统线性模型失效
  - OLS无法估计(参数过多)
  - 高度多重共线性
  - 数据挖掘与过拟合风险激增

具体挑战: Hou, Xue & Zhang (2015)估计可能存在300+个经济相关特征;多重检验问题加剧;发表后衰减现象普遍

ML应用1:降维方法——PCA与Sparse PCA

问题: 数千个特征,但可能只有少数"真实风险因子"

方法:

  • 主成分分析(PCA):提取解释收益方差最多的少数主成分,即自动寻找"隐含因子"
  • 稀疏PCA(Sparse PCA):增加稀疏约束,得到更易解释的成分

实证应用:

Kelly, Pruitt & Su (2019): 将1500+个特征投入PCA,提取出4-5个主成分,能解释美国股市横截面收益,相比FF5因子样本外预测能力更强

Gu, Kelly & Xiu (2020): 用深度学习自编码器提取潜在因子,完全数据驱动

ML应用2:特征筛选——LASSO与Elastic Net

问题: 从海量特征中找出"真正重要的"

方法:

  • LASSO(L1正则化),自动将不重要变量系数压为0
  • Elastic Net(L1+L2混合):兼具LASSO的稀疏性和Ridge的稳定性

实证应用:

  • Feng, Giglio & Xiu (2020): 用LASSO从数千个特征中筛选出约70个最相关特征,构造"LASSO因子"
  • Kozak, Nagel & Santosh (2020): 用机器学习方法估计"最优SDF"

ML应用3:非线性学习——树模型与神经网络

A. 梯度提升(Gradient Boosting):XGBoost, LightGBM, CatBoost

B. 深度神经网络(Deep Learning):多层隐层自动学习特征间的复杂关系

C. CNN / RNN:处理高维结构数据和时间序列依赖

实证应用:

Gu, Kelly & Xiu (2020) "Empirical Asset Pricing via Machine Learning":用5种ML方法预测个股收益,神经网络方法的样本外Sharpe比率是传统因子模型的2-3倍

Kozak, Nagel & Santosh (2020): 用神经网络学习时变SDF参数

ML应用4:IPCA与自编码器

IPCA(Instrumented PCA)—— Kelly, Pruitt & Su (2019)

核心思想:使用公司特征作为"工具变量",学习特征与的映射关系

将Daniel & Titman (1997)的"特征vs协方差"争议用ML框架统一

Autoencoder Asset Pricing—— Gu, Kelly & Xiu (2021)

Encoder将高维特征压缩到隐因子,Decoder重构收益

结果:CAPM年化Sharpe 0.46,FF5为0.58,Autoencoder达0.86

ML方法的关键评估标准

评估维度 传统方法 ML方法的新挑战
样本内拟合 容易过拟合,需要CV
样本外表现 alpha、Sharpe 需要walk-forward测试
稳定性 β显著性 特征重要性排序稳定吗?
可解释性 回归系数 神经网络黑箱,难以解释
多重检验 p值修正 ML的"有效p值"定义困难

核心困境: ML方法在"样本外预测"上更优,但在"经济解释与理论联系"上更弱

2.8 Module 2 总结与方法选择指南

研究问题 推荐方法 原因
某模型是否能定价这些资产? 时间序列回归 直接检验α
某因子是否被定价? FM两步法或SDF 直接给出λ
某特征与收益的关系强度? 排序组合 直观、易沟通
某特征是否具有独立定价能力? 特征回归+排序 分离直接效应
理论SDF是否成立? GMM/SDF 理论导向

完整研究流程: 发现阶段(排序)→ 检验阶段(时间序列+FM)→ 理论检验(SDF/GMM)→ 稳健性(跨样本、样本外)

Module 3

"显著"的三重含义与检验框架

  • 问题导入:什么是"显著"?
  • 三重含义详解
    • β显著:暴露显著
    • λ显著:风险价格显著
    • α显著:定价误差显著
  • 三重含义的关键区分
  • 实证可靠性的三要素
  • 小结

3.1 问题导入:什么是"显著"?

常见混淆:

在实证资产定价中,我们经常说某个结果"显著"。但这个"显著"可能指三种完全不同的东西。

反面例子:

假设某论文报告:"X因子显著地定价解释资产收益"。这可能意味着:

  • 资产对X因子的β显著()?
  • X因子的风险价格显著()?
  • 加入X因子后模型的α显著下降?
  • 还是全部都有?

这三种"显著"的底层模型、检验方法和经济含义都不同。

3.2 含义1:显著(暴露显著)

模型形式:

检验: vs

t统计量:

经济含义: 资产确实暴露于因子,即资产的收益与该因子风险共动

重要限制: 显著 因子被定价 代表风险

实例: 小盘股的"交易量"与收益显著正相关。可能解释:

  1. 交易量代表流动性风险(β显著+λ显著)
  2. 仅是巧合相关,市场不定价(β显著,但λ=0)
  3. 被其他因子解释(显著性消失)

含义2:显著(风险价格显著)

模型形式(FM框架):

检验: vs

t统计量:

经济含义:

  • 暴露于因子更多的资产,在横截面上有更高的平均收益
  • 因子的风险被市场定价,承担该风险需要补偿
  • 的量级表示风险补偿的大小(%/月或%/年)

重要提示: 显著为“该因子(或其代理)在测试集合上被定价”的证据,但不等价于证明其为真实风险机制

显著:实例

FF3模型中λ_HML显著

可能解释:
1. HML代表真实的"价值风险"
   → 高B/M公司更多暴露于灾难性或衰退风险
2. 或HML只是价值特征的代理
   → 市场系统性高估成长、低估价值
3. 判别需要额外证据:HML与衰退/流动性压力的关系

含义3:显著(定价误差显著)

模型形式:

检验:

  • 单个资产: vs
  • 多个资产(GRS联合检验):

经济含义:

  • 模型无法解释该资产的平均收益
  • 该资产的平均收益 ≠ 其风险暴露 × 风险价格
  • 在给定的模型设定与测试资产集合上,若 (尤其在联合意义下不被拒绝),才支持“模型能够正确定价这些资产的平均收益”

α显著 = 模型存在系统性定价误差,但不能指出哪里出了问题

显著:实例

某排序组合(动量多空)在FF5模型下α显著

可能原因:
1. FF5遗漏了动量风险因子
   → 加入动量因子后α消失
2. 动量是真实的市场错误定价
   → 即使加任何因子也不能完全解释
3. 动量收益来自交易成本或流动性挤兑
   → 是摩擦而非风险或误定价

单从"α显著"看不出来,需要进一步分析。

3.3 三种显著性的关键区分(证据层面)

三种显著性的区别:

维度 β显著 λ显著 α显著
检验对象 检验资产对因子的暴露: 检验因子的风险价格: 检验模型在测试集合上的定价误差:
检验口径 时间序列(单个资产的共动) 横截面(多个资产的定价关系) 时间序列(联合,如GRS等)
统计含义 资产与因子共动显著 风险溢价关系在横截面上显著 模型无法在该测试集合上完全解释平均收益
对“风险/错误定价”的提示 仅说明“暴露”,不自动说明“被补偿” 提示“该因子(或其代理)在横截面上被定价”,但不必然说明其为真实风险 提示“存在系统性定价误差”,但无法直接指出具体遗漏/机制来源
互推关系 β≠0 不能推出 λ≠0 λ≠0 不能推出 α=0 α=0 不能推出 因子一定是真实风险

三种情况的推论

  1. β显著但λ不显著: 资产与因子共动存在,但不被补偿

    例:某资产与流动性高度相关(β显著),但市场不定价流动性(λ ≈ 0)
    
  2. λ显著但α不为0: 因子被定价但不能完全解释资产收益

    例:SMB在FF3中λ显著,但许多小盘股的α仍显著 → 可能遗漏了小盘股特有的另一个因子
    
  3. α=0但β或λ不显著: 资产定价合理但无异常收益

    例:某高度特异化资产,与任何因子都不相关(β=0),但在模型内α接近0
    

3.4 实证可靠性的三要素

即使结果"显著",也需要检验三个维度的稳健性:

实证结果的三重检验:

1. 模型设定 ← 你是否选对了因子和资产?
2. 统计推断 ← 你的标准误选择对吗?
3. 样本外有效性 ← 结果在新数据上能复现吗?

要素1:模型设定的正确性

问题清单:

  • 因子是否足够多?(遗漏因子问题)
  • 因子是否正确测量?(测量误差)
  • 测试资产空间是否合适?(资产选择)
  • 时间段是否包含足够市场状态?(周期覆盖)

检验方法:

  1. 遗漏因子检验: 若加入新因子后α大幅下降,说明之前的模型设定有偏

    • 例:在HML之外加入RMW(盈利因子)→ 许多FF3的α消失
  2. 子样本检验: 不同时期、不同市场的α是否一致?

    • 例:若规律仅在1990-2000年显著,此后消失 → 可能是数据挖掘

要素2:统计推断的正确性

问题清单:

  • 标准误的选择是否正确?(Newey-West? 聚类?)
  • 是否考虑了多重检验问题?(Bonferroni? FDR?)
  • 是否存在errors-in-variables偏误?(β估计误差)
  • 样本量是否足够?(小样本修正)

多重检验问题: 同时检验100个因子,即使全部为噪声,也期望约5个显著(

修正方法:

  • Bonferroni修正:p值 × 检验次数(最保守)
  • FDR(False Discovery Rate)修正:更温和
  • Romano & Wolf (2005):资产定价特有的修正框架

要素3:样本外有效性与稳健性

问题清单:

  • 结果在其他样本期间是否成立?(样本外)
  • 结果在其他市场是否成立?(跨地域)
  • 结果在不同子样本是否稳定?(子样本稳定)
  • 发表后是否衰减?(发表后效应)

常见现象:发表后衰减(Post-publication decay)

许多学术论文中发现的异常收益,发表后显著衰减。原因:

  • 数据挖掘与过拟合
  • 发现后被套利消除
  • 初始样本的幸运性选择

Arnott, Beck, Kalesnik & West (2016): 已发布异常收益平均衰减35-45%

样本外检验方法

  1. 样本外检验

    第一步:用1980-2000年数据发现规律
    第二步:用2001-2020年数据验证
    若新样本期α显著衰减或消失 → 原发现可能是样本内偶然
    
  2. 跨市场复现

    若在美国发现某规律,检验其在中国、日本、欧洲是否存在
    若完全不存在 → 可能是美国特有的市场摩擦或数据特征
    
  3. 子样本分析

    按规模、流动性、行业等分层
    若规律仅在难套利子集显著 → 更支持"错误定价"而非"真实风险"
    

3.5 Module 3 小结

核心结论:

  1. “显著”有三重含义,缺一不可(证据层面)

    • β显著:资产与因子共动
    • λ显著:因子在横截面上被定价(或其代理)
    • α≈0:模型在测试集合上能较好解释平均收益(联合意义下)
    • 三者相互补充,但单独任何一个都不能单方面证明“因子一定是真实风险”
  2. 实证可靠性的三要素缺一不可

    • 模型设定正确(因子/资产空间/测度)
    • 统计推断稳健(SE、EIV、多重检验)
    • 样本外有效(复现与稳健性)
  3. 实用检验清单

    • 因子是否跨期稳定?跨市场/跨国稳定?
    • 加入新因子后α是否显著下降?
    • 使用了正确的SE(NW + 聚类)?
    • 是否做了多重检验修正?
    • 发表后该规律是否衰减?

Module 4

风险vs错误定价的判别框架

  • 核心难点
  • 四层判别框架
    • 统计显著性筛选
    • Beta定价关系检验
    • 坏状态表现检验
    • 套利限制与行为证据
  • ML时代的新范式
  • 小结

4.1 问题的核心难点

基本困境:

给定某个异常收益(如小盘股溢价、动量效应、价值溢价等),并在某个候选因子模型与测试资产集合下,我们观察到:

三种可能的解释都能与数据一致:

  1. 风险补偿解释: 异常收益代表承担系统性风险的补偿
  2. 错误定价解释: 市场参与者因信息不完全、认知偏差而误定价
  3. 混合解释: 既有风险成分,也有错误定价成分

为什么无法通过统计显著性区分?

无论是"真实但隐藏的风险"还是"系统性错误定价",都会在数据中表现为可预测的收益差异和显著的。两者的数据痕迹往往无法区分!

4.2 四层判别框架

虽然无法百分百确定,但可以通过多层证据的支持程度来倾向于某种解释。

第一层:统计显著性筛选

确认异常收益的显著性,但这只是开始。

检验清单:

  • 使用了正确的SE(Newey-West + 聚类)?
  • 做了多重检验修正?
  • 结果在样本外是否成立?
  • 在不同子样本是否稳定?

第二层:Beta定价关系检验

关键问题: 该异常收益是否通过"β-λ关系"被定价?

检验逻辑: 构造高(H)、低(L)异常收益的两个组合,分析它们的β向量

  1. 令因子向量为 (维度 )。估计两组组合的因子暴露向量(多因子向量形式):

    其中
  2. 计算差分暴露向量:

  3. 在定价模型成立时,风险价格对收益差的预测满足:

    • 接近 → 更倾向“风险补偿”
    • 明显小于 → 更倾向“错误定价”

理论基础: Daniel & Titman (1997) — 区分"特征效应" vs "协方差风险"

  • 风险补偿:高收益由高β驱动(协方差通道)
  • 错误定价:高收益由特征本身驱动,与β无关(特征通道)

Beta定价检验:直观例子

观察:小盘股年平均超额收益 8%

情景A:β定价能解释
- 小盘股 β_SMB = 1.5(高度暴露于规模因子)
- 规模因子 λ_SMB = 5%/年
- 预测收益增量 = 1.5 × 5% = 7.5%
- 实际8% ≈ 预测7.5% → 风险补偿能基本解释

情景B:β定价解释不了
- 小盘股 β_SMB = 0.3(低度暴露)
- 规模因子 λ_SMB = 5%
- 预测收益增量 = 0.3 × 5% = 1.5%
- 实际8% ≫ 预测1.5% → 更像是错误定价

第三层:坏状态表现检验(关键)

关键问题: 该异常收益在"坏状态"下是否表现更差?

理论基础: 如果某个风险是真实的系统性风险,承担这个风险的资产应该在投资者最痛苦的时刻表现最差(与正相关的资产需要更高期望收益)

坏状态的定义:

坏状态类型 具体指标 对应理论
经济衰退 GDP增速↓、失业率↑ CCAPM核心机制
消费压力 消费增长下降 Lucas (1978)
金融压力 VIX升高、信用息差↑ 制度转换模型
流动性压力 买卖价差↑、融资成本↑ Acharya & Pedersen (2005)

坏状态检验:方法1——分区间分析

将样本分为"好状态"和"坏状态":

好状态:GDP增速 > 中位数,VIX < 中位数
坏状态:GDP增速 < 中位数,VIX > 中位数

计算多空组合在两个状态下的回报:

结论判断:
- 若坏状态下R_bad > R_good → 与风险补偿逻辑不符 → 更支持"错误定价"
- 若坏状态下R_bad < R_good → 符合风险补偿逻辑 → 更支持"风险"解释

方法2:条件CAPM/SDF框架

其中表示经济状态。

第四层:套利限制与行为偏差证据

关键问题: 是否存在阻止套利消除错误定价的机制?

套利限制的类型:

类型 具体含义 实证表现
交易成本 佣金、买卖价差 规律在交易成本高的资产中显著
流动性限制 无法迅速交易 低流动性股票中规律强
做空限制 做空成本高 多头端易被套利,空头端不能
融资约束 融资成本高 套利者资本不足

套利限制检验方法

方法1:按流动性分组

将股票按流动性分成高、中、低三组
- 高流动性股票:α ≈ 0(易被套利消除)
- 低流动性股票:α 很大且显著(套利困难)
→ 强烈支持"错误定价 + 套利限制"解释

方法2:按规模分组

如果异常收益主要来自小盘股:
α(微盘) > α(小盘) > α(中盘) > α(大盘)
→ 更支持"套利限制导致的错误定价"

方法3:行为偏差变量检验

行为偏差 操作化方法
投资者情绪 Baker-Wurgler情绪指数
注意力不足 新闻数量、搜索热度
过度反应 极端过去收益

4.3 综合判别框架:案例应用

案例1:动量效应

检验维度 结果 含义
第一层:统计显著 t值>2,样本外仍存在 ✓ 通过筛选
第二层:Beta定价 Δβ很小,λ'Δβ ≪ 实际α ✗ β无法解释,更像误定价
第三层:坏状态表现 危机时动量反向,好时alpha为正 ✗ 不符合风险逻辑
第四层:套利限制 主要在小盘股、低流动性股中显著 ✗ 支持套利限制+误定价
综合结论 动量效应主要是行为错误定价,部分是套利限制

案例2:价值效应

检验维度 结果 含义
第一层:统计显著 t值持续稳定,跨国复现 ✓ 通过筛选
第二层:Beta定价 高B/M组Δβ显著,λ'Δβ≈实际α ✓ β定价能解释大部分
第三层:坏状态表现 衰退期高B/M表现更差 ✓ 符合风险逻辑
第四层:套利限制 大盘股中也显著存在 ✓ 不依赖套利限制
综合结论 价值效应主要是真实风险补偿(衰退风险或流动性风险)

4.4 ML时代的新范式

传统范式的核心逻辑:

理论预言 → 数据检验 → 得出结论
   ↓
"手工"构造因子 → 线性定价模型 → α检验

面临的困境:

  1. 特征爆炸 vs 理论稀缺: 数百个"显著"特征,但理论上难以全部解释
  2. 线性假设过于简单: 特征与收益关系明显非线性
  3. 时变性被忽视: β、λ在经济周期中明显变化
  4. 发表后衰减问题恶化: 异常收益平均衰减35-45%

ML范式:从"假设检验"到"预测与学习"

关键转变:

转变1:从"假设检验"到"预测评价"

  • 传统: 发现一个因子
  • ML:样本外实际可赚的alpha才是核心

转变2:从"手工特征"到"自动发现"

  • 传统:学者靠理论与直觉挑选因子
  • ML:把所有候选特征投入算法,自动学习最优组合

转变3:从"线性模型"到"灵活非参数模型"

  • 传统:
  • ML:

ML与传统方法的融合前景

现阶段共识:并非"ML取代传统",而是互补与融合

研究环节 传统方法 ML方法 融合形式
因子发现 理论推导 自动筛选 理论候选+ML验证
定价关系 线性因子模型 神经网络 线性基准+非线性检验
样本外评价 α、Sharpe Walk-forward CV 时间序列+交叉验证混合
可解释性 清晰的β系数 SHAP特征重要性 两层并行解释

掌握ML工具的资产定价研究者,未来应该是:既懂理论、又懂数据、还会评价

4.5 Module 4 小结

  1. 无法仅通过统计显著性区分风险与错误定价——需要多层证据综合判断

  2. 四层判别框架按递进:

    • 第一层:基本统计可靠性
    • 第二层:理论机制检验(β定价关系)
    • 第三层:经济意义检验(坏状态表现)
    • 第四层:现实障碍检验(套利限制、行为证据)
  3. 风险解释的特征: β定价关系成立、坏状态表现更差、跨市场稳健、不依赖交易成本

  4. 错误定价的特征: 主要在难套利资产中显著、与情绪变量相关、发表后显著衰减

  5. 重要提醒: 四层框架提供的是支持程度,而非充分条件。现实中往往既有风险成分也有误定价成分

讲授部分总结

四个模块的核心主线:

Module 1:理论基础
   SDF → 线性因子模型 → E(R_i) = β_i' λ
          ↓
Module 2:经验方法
   时间序列 / FM两步法 / 排序 / 特征回归 / SDF-GMM
          ↓
Module 3:统计显著性框架
   β显著 / λ显著 / α显著 → 实证可靠性三要素
          ↓
Module 4:经济含义判别
   风险补偿 vs 错误定价 — 四层判别框架

实践部分

分组项目制(80分钟)

  • 实践部分总体安排
  • 项目主题选择(7个可选)
  • 实践指导方案
  • 分组汇报与讨论
  • 课程总结

实践部分总体安排

形式:分组项目制

  • 分组:建议3-4人/组
  • 时间:80分钟(含指导与汇报)
    • 项目实践操作:50分钟
    • 分组汇报与讨论:30分钟

目的:

  • 让学生操作一次完整的实证资产定价研究
  • 从数据、假设、方法选择中体验理论与现实的冲突
  • 培养批判性思维
  • 体会实证可靠性的三要素

主题1:A股小盘股溢价是否存在?(基础难度)

研究问题:

  • 按市值分组A股股票,检验小盘股是否具有显著超额收益
  • 该超额收益是否能被FF3因子解释?

方法步骤:

  1. 按市值5分位排序,构造等权组合
  2. 计算各组年化超额收益
  3. 时间序列回归FF3(或CAPM)
  4. 检验高低组多空收益alpha及稳健性
  5. 按流动性分组,检验套利限制假说

预期难点: ST股处理、新股/停牌股、无风险利率获取、生存者偏差

主题2:动量因子在中国股市中是否可定价?(中等难度)

研究问题:

  • 构造动量因子(过去12个月收益排序,排除近1月)
  • 检验其显著性、稳定性和定价特征

方法步骤:

  1. 按过去12月收益排序(标准Jegadeesh & Titman, 1993做法)
  2. 构造赢家-输家多空组合
  3. 计算原始收益率和风险调整后alpha(FF3、FF5)
  4. FM两步法检验动量因子的风险价格
  5. 状态依赖分析(好年份/坏年份/危机期)

关键思考题: 动量效应在危机期反向(momentum crash)、中国动量为何强?

主题3:应计项异常能否被现有模型解释?(中等难度)

研究问题: 基于Sloan (1996)的经典发现,检验应计项是否能预测超额收益

方法步骤:

  1. 计算每个公司的应计项比率
  2. 按应计项分5组
  3. 检验低应计组 - 高应计组的收益差异
  4. FM回归检验应计项溢价
  5. 加入不同因子集合(CAPM→FF3→FF5→q-factor),检验alpha的递进下降

关键思考题: 低应计高收益是投资者"会计天真"还是真实风险?

主题4:融资约束是否是定价因子?(高难度)

研究问题: 融资受约束的公司是否有更高超额收益?

方法步骤:

  1. 计算多种融资约束指数(KZ index / WW index / SA index)
  2. 按融资约束分组,比较高低组收益
  3. 构造融资约束因子
  4. 检验FC因子在现有模型中的增量解释力

理论连接:

  • Fazzari, Hubbard & Petersen (1988)
  • Almeida, Campello & Weisbach (2004)

主题5:特征效应是否源于协方差风险?(高难度)

研究问题: 基于Daniel & Titman (1997)框架,区分特征效应与协方差风险

方法步骤:

  1. 按特征排序构造5分位组合
  2. 对每个组合计算特征值和历史beta
  3. FM回归:同时加入特征和beta

  4. 若只有特征显著 → 特征效应;只有beta显著 → 协方差效应

预期难点: Beta估计误差(EIV问题)、特征与beta的多重共线性

主题6:中国股市中是否存在流动性风险溢价?(高难度)

研究问题: 基于Acharya & Pedersen (2005)框架,流动性风险是否被定价?

方法步骤:

  1. 计算多种流动性度量(Amihud measure, 换手率等)
  2. 计算流动性beta
  3. 按流动性敏感性分组,检验高敏感性是否有高收益
  4. FM法检验流动性因子风险价格

理论连接:

  • Acharya & Pedersen (2005): 流动性风险模型
  • Pastor & Stambaugh (2003): 流动性因子
  • Amihud (2002): ILLIQ measure

主题7:用ML方法审视经典规律(可选高阶选题)

研究问题: 经典的FF5因子,用ML方法能否进一步改进?

方法步骤:

  1. 用LASSO从100+特征中筛选最相关的
  2. 用XGBoost或神经网络学习非线性定价关系
  3. 与FF5进行样本内和样本外对比
  4. 分析特征重要性排序

预期难点:

  • 样本期短,ML容易过拟合
  • 中国股市特性(涨跌停板)对ML的影响
  • 如何设计合理的交叉验证方案

实践指导:阶段1——项目启动与分工(15分钟)

教师讲解(5分钟):

  • 快速回顾该主题的理论背景
  • 指出常见的方法选择陷阱
  • 特别提醒:三个实证可靠性要素

学生分工(10分钟):

  • 每组选择一个主题
  • 明确分工:
    • 数据获取与清洗负责人
    • 方法设计与编程负责人
    • 结果解释与汇报负责人

实践指导:阶段2——操作流程

第1步:数据准备(5分钟)

  • 数据来源确认(CSMAR? Wind? Tushare?)
  • 样本量足够吗?(至少100个资产×60个月)
  • 清洗:极端值处理、停牌处理、生存者偏差

第2步:方法实现(20分钟)

  • 排序组合构造(等权还是市值权重?)
  • 时间序列/FM回归设定
  • 标准误计算(最关键!!!)
  • 检验统计量(t值、p值、GRS检验)

第3步:结果初步分析(10分钟)

  • 基本统计显著吗?
  • 结果和已有文献一致吗?
  • 下一步应检验什么?

实践指导:常见陷阱与干预

陷阱 表现 教师干预
多重检验偏误 "我检验了100个特征,其中5个显著" 提醒:可能是随机噪声,需Bonferroni/FDR修正
幸存者偏差 数据只包含存活到2024年的公司 讨论偏误方向,检验样本外
交易成本忽视 宣称策略年化收益20%没考虑成本 追问:实际可实现吗?
数据挖掘 样本内发现规律直接宣布 强调必须样本外验证
假显著性 用OLS SE而非Newey-West 这是判断结果可靠性的第一道关
特征vs风险混淆 特征显著就说它是风险因子 需要用FM法确认β定价关系

阶段3:分组汇报结构(每组5-7分钟)

1. 研究问题与动机(1分钟)
   - 为什么重要?与已有文献关系?中国特殊性?

2. 数据与方法(1.5分钟)
   - 样本期、样本量、数据来源
   - 关键变量定义与计算
   - 使用的方法

3. 核心结果展示(2分钟)
   - 排序表、alpha值、显著性
   - 可视化图表

4. 稳健性检验(0.5分钟)

5. 经济含义与讨论(1分钟)
   - 风险还是误定价?

6. 问题与反思(0.5分钟)

课堂讨论与课程总结

教师反思问题:

  • 理论挑战: "你说这是风险,但为什么在坏时期没有更差表现?"
  • 方法挑战: "你用的标准误是Newey-West吗?"
  • 稳健性挑战: "这个结果在2020年后还存在吗?"
  • 经济挑战: "扣除交易成本,这个策略还赚钱吗?"

课程核心收获:

  1. 从理论SDF到实证方法的完整链条
  2. "显著"的三重含义及相互关系
  3. 风险vs错误定价的判别框架
  4. 实证可靠性的三要素

推荐阅读

经典论文:

理论基础:

  • Breeden (1979) — ICAPM
  • Hansen & Jagannathan (1997) — SDF规范检验

标准方法:

  • Sharpe (1964) — CAPM
  • Fama & MacBeth (1973) — 两步法
  • Fama & French (1993) — FF3
  • Fama & French (2015) — FF5

关键问题:

  • Gibbons, Ross & Shanken (1989) — GRS检验
  • Jegadeesh & Titman (1993) — 动量效应
  • Daniel & Titman (1997) — 特征vs风险

显著性与稳健性:

  • Newey & West (1987) — 协方差估计
  • Romano & Wolf (2005) — 多重检验修正
  • Shanken (1992) — EIV修正

机器学习应用:

  • Gu, Kelly & Xiu (2020) — JF, ML资产定价
  • Gu, Kelly & Xiu (2021) — JoE, 自编码器模型
  • Kelly, Pruitt & Su (2019) — JF, IPCA
  • Kozak, Nagel & Santosh (2020) — JF, 压缩截面
  • Feng, Giglio & Xiu (2020) — JF, LASSO因子筛选
  • Arnott et al. (2016) — 发表后衰减

数据与软件资源

数据库推荐:

  • CSMAR(国泰安)— 学术研究标准数据
  • Wind — 综合金融终端
  • DigQuant - 点宽
  • Tushare / AkShare — 开源数据(免费)
  • 巨潮资讯(cninfo)— 上市公司公告

软件与包:

  • Python: statsmodels, scikit-learn, pandas, numpy
  • R: tidyverse, sandwich, lmtest
  • Stata: xtscc, newey

本周总结

实证资产定价是一门"证据积累"的科学。单一p值不足以支撑结论,好的实证论文需要多层证据。

核心信息:

  • 数学公式和回归技巧并非难点,难点在于理解结果的真实含义
  • "统计显著" ≠ "经济含义显著" ≠ "因果关系确立"
  • 实证可靠性需要三层保证:模型设定正确 → 统计推断稳健 → 样本外有效

预习准备

  • 复习Backtrader回测框架
  • 阅读EMH和行为金融学概念
  • 安装:backtrader/DigQuant, yfinance

下周预告
Week 6: AI时代量化交易

  • Backtrader/DigQuant回测框架
  • TradingAgents多Agent系统
  • ATLAS自适应交易
  • QuantAgent高频信号
  • HFT理论与模型
  • LLM+MCTS因子挖掘

## Newey-West标准误 **公式:** $$SE_{NW} = \sqrt{\frac{1}{T}\left( \sum_{t=1}^T x_t \varepsilon_t \right)^2 + 2 \sum_{j=1}^L w_j \sum_{t=j+1}^T x_t \varepsilon_t x_{t-j} \varepsilon_{t-j}}$$ 其中$w_j = 1 - \frac{j}{L+1}$为Bartlett核权重,滞后阶数$L$通常取$\text{floor}(1.3 \times \sqrt{T})$。 **要点:** - 同时处理异方差和自相关 - 滞后阶数的选择影响标准误大小 - 月度数据通常取$L = 6$或$L = 12$ ---