<center> Week 5 实证资产定价 </center>

情景	资产A	资产B
经济繁荣	收益高	收益低
经济衰退	暴跌	反而强势（收益上升）
与关系	↑时收益↓	↑时收益↑
期望收益要求	高（需要风险补偿）	低（类似保险）

参数	含义	理论期望
	资产在期的超额收益（相对无风险利率）	—
	因子向量（如市场超额收益、SMB等）	—
	暴露向量，资产对各因子的敏感度	任意
	定价误差（alpha）	0（模型正确定价）
	模型残差	均值为0

方法	核心思想	主要检验对象	适用场景
时间序列回归	对每个资产做时间序列回归，检验	定价误差	多资产定价检验、模型有效性
FM两步法	先估计，再在横截面上检验	风险价格	因子定价检验、因子重要性比较
排序组合	按特征分组，比较高低组平均收益	特征与收益的关系	异常收益发现、新规律识别
特征回归	直接在收益上回归特征	特征的预测能力	特征效应识别、特征定价检验
SDF/GMM	从理论SDF约束出发，用GMM检验矩条件	定价核可行性	理论模型检验、多资产联合定价

因子	定义	代表论文
市场因子		Sharpe (1964) CAPM
规模因子		Fama & French (1993)
价值因子		Fama & French (1993)
动量因子		Carhart (1997)
盈利因子		Fama & French (2015)
投资因子		Fama & French (2015)

标准误类型	处理问题	代表方法
OLS标准误	无（理想情况）	—
White稳健SE	异方差	White (1980)
Newey-West SE	异方差 + 自相关	Newey & West (1987)
聚类稳健SE	跨截面相关	Cluster-Robust
NW + 聚类	同时处理	双聚类

检验结果	解读
多数资产显著 > 0	模型低估了某些资产的收益
多数资产显著 < 0	模型高估了某些资产的收益
大幅偏离0，GRS联合检验显著	模型存在系统性定价误差
，GRS不显著	模型在统计上可接受

情况	含义
显著 > 0	因子被正风险溢价定价，暴露越多风险越高
显著 < 0	因子被负风险溢价定价（类似"保险"资产）
不显著	因子在横截面上不被定价

方面	时间序列回归	FM两步法
检验对象	（各资产的定价误差）	（各因子的风险价格）
核心问题	模型能否定价这些资产？	这些因子是否被定价？
优点	直接、易解释；可检验每个资产	接近理论框架；直接显示风险价格
缺点	不直接显示因子风险价格	标准误计算较复杂
适用场景	多资产定价有效性评估	新因子的风险价格检验

特征	定义	代表规律	关键论文
市值	股票总市值	小盘股溢价	Fama & French (1992)
账面市值比	账面价值/市值	价值溢价	Fama & French (1992)
动量	过去12月收益（排除近1月）	动量效应	Jegadeesh & Titman (1993)
盈利能力	ROE、毛利率等	盈利溢价	Fama & French (2015)
投资	资产增长率	投资异常	Fama & French (2015)
应计项	应计利润/总资产	应计异常	Sloan (1996)

结果	含义
原始多空收益显著	该特征与平均收益显著相关
调整后alpha仍显著	现有模型（如FF3）不能解释这个收益
调整后alpha不显著	现有模型能解释这个收益规律

J-test结果	含义
不显著（p > 0.05）	模型的矩条件在统计上不被拒绝，模型可接受
显著（p < 0.05）	模型的矩条件被拒绝，说明SDF定价有系统误差

方面	说明
优点	更接近理论本体；可同时检验多个资产的定价
局限	假设模型正确；拒绝不一定指出问题所在；过度敏感

评估维度	传统方法	ML方法的新挑战
样本内拟合	R²	容易过拟合，需要CV
样本外表现	alpha、Sharpe	需要walk-forward测试
稳定性	β显著性	特征重要性排序稳定吗？
可解释性	回归系数	神经网络黑箱，难以解释
多重检验	p值修正	ML的"有效p值"定义困难

研究问题	推荐方法	原因
某模型是否能定价这些资产？	时间序列回归	直接检验α
某因子是否被定价？	FM两步法或SDF	直接给出λ
某特征与收益的关系强度？	排序组合	直观、易沟通
某特征是否具有独立定价能力？	特征回归+排序	分离直接效应
理论SDF是否成立？	GMM/SDF	理论导向

维度	β显著	λ显著	α显著
检验对象	检验资产对因子的暴露：	检验因子的风险价格：	检验模型在测试集合上的定价误差：
检验口径	时间序列（单个资产的共动）	横截面（多个资产的定价关系）	时间序列（联合，如GRS等）
统计含义	资产与因子共动显著	风险溢价关系在横截面上显著	模型无法在该测试集合上完全解释平均收益
对“风险/错误定价”的提示	仅说明“暴露”，不自动说明“被补偿”	提示“该因子（或其代理）在横截面上被定价”，但不必然说明其为真实风险	提示“存在系统性定价误差”，但无法直接指出具体遗漏/机制来源
互推关系	β≠0 不能推出 λ≠0	λ≠0 不能推出 α=0	α=0 不能推出因子一定是真实风险

三种情况的推论

β显著但λ不显著： 资产与因子共动存在，但不被补偿

例：某资产与流动性高度相关（β显著），但市场不定价流动性（λ ≈ 0）

λ显著但α不为0： 因子被定价但不能完全解释资产收益

例：SMB在FF3中λ显著，但许多小盘股的α仍显著 → 可能遗漏了小盘股特有的另一个因子

α=0但β或λ不显著： 资产定价合理但无异常收益

例：某高度特异化资产，与任何因子都不相关（β=0），但在模型内α接近0

坏状态类型	具体指标	对应理论
经济衰退	GDP增速↓、失业率↑	CCAPM核心机制
消费压力	消费增长下降	Lucas (1978)
金融压力	VIX升高、信用息差↑	制度转换模型
流动性压力	买卖价差↑、融资成本↑	Acharya & Pedersen (2005)

类型	具体含义	实证表现
交易成本	佣金、买卖价差	规律在交易成本高的资产中显著
流动性限制	无法迅速交易	低流动性股票中规律强
做空限制	做空成本高	多头端易被套利，空头端不能
融资约束	融资成本高	套利者资本不足

行为偏差	操作化方法
投资者情绪	Baker-Wurgler情绪指数
注意力不足	新闻数量、搜索热度
过度反应	极端过去收益

检验维度	结果	含义
第一层：统计显著	t值>2，样本外仍存在	✓ 通过筛选
第二层：Beta定价	Δβ很小，λ'Δβ ≪ 实际α	✗ β无法解释，更像误定价
第三层：坏状态表现	危机时动量反向，好时alpha为正	✗ 不符合风险逻辑
第四层：套利限制	主要在小盘股、低流动性股中显著	✗ 支持套利限制+误定价
综合结论	动量效应主要是行为错误定价，部分是套利限制

检验维度	结果	含义
第一层：统计显著	t值持续稳定，跨国复现	✓ 通过筛选
第二层：Beta定价	高B/M组Δβ显著，λ'Δβ≈实际α	✓ β定价能解释大部分
第三层：坏状态表现	衰退期高B/M表现更差	✓ 符合风险逻辑
第四层：套利限制	大盘股中也显著存在	✓ 不依赖套利限制
综合结论	价值效应主要是真实风险补偿（衰退风险或流动性风险）

研究环节	传统方法	ML方法	融合形式
因子发现	理论推导	自动筛选	理论候选+ML验证
定价关系	线性因子模型	神经网络	线性基准+非线性检验
样本外评价	α、Sharpe	Walk-forward CV	时间序列+交叉验证混合
可解释性	清晰的β系数	SHAP特征重要性	两层并行解释

陷阱	表现	教师干预
多重检验偏误	"我检验了100个特征，其中5个显著"	提醒：可能是随机噪声，需Bonferroni/FDR修正
幸存者偏差	数据只包含存活到2024年的公司	讨论偏误方向，检验样本外
交易成本忽视	宣称策略年化收益20%没考虑成本	追问：实际可实现吗？
数据挖掘	样本内发现规律直接宣布	强调必须样本外验证
假显著性	用OLS SE而非Newey-West	这是判断结果可靠性的第一道关
特征vs风险混淆	特征显著就说它是风险因子	需要用FM法确认β定价关系

Week 5 实证资产定价

Empirical Asset Pricing: Methods, Models, and Evidence

课程概览

学习成果

课程结构

Module 1

基本框架与核心逻辑

1.1 导入问题：为什么资产收益不同？

案例：小盘股溢价

1.2 资产定价的基本逻辑

SDF 约束的直观理解

风险溢价与 SDF 的协方差关系

线性因子模型

1.3 核心变量与基本设定

横截面定价关系

1.4 预期收益的两个层面

三个重要的等式关系

1.5 Module 1 小结

Module 2

五大经验方法

2.1 方法概览与适用场景

2.2 方法1：时间序列因子回归

时间序列回归：步骤与检验

标准误的正确选择

Newey-West标准误

时间序列回归：结果解读

2.3 方法2：Fama-MacBeth两步法

FM两步法：具体步骤

FM两步法：统计推断

FM两步法：结果解读

FM两步法 vs 时间序列回归

2.4 方法3：排序组合

常见排序变量与异常收益

排序组合设计

排序组合：风险调整后的alpha检验

排序组合案例：价值因子检验

2.5 方法4：特征回归

特征回归：重要限制

2.6 方法5：SDF/GMM方法

GMM：J-test解读

2.7 机器学习在因子筛选与定价中的应用（高阶）

ML应用1：降维方法——PCA与Sparse PCA

ML应用2：特征筛选——LASSO与Elastic Net

ML应用3：非线性学习——树模型与神经网络

ML应用4：IPCA与自编码器

ML方法的关键评估标准

2.8 Module 2 总结与方法选择指南

Module 3

"显著"的三重含义与检验框架

3.1 问题导入：什么是"显著"？

3.2 含义1：显著（暴露显著）

含义2：显著（风险价格显著）

显著：实例

含义3：显著（定价误差显著）

显著：实例

3.3 三种显著性的关键区分（证据层面）

三种情况的推论

3.4 实证可靠性的三要素

要素1：模型设定的正确性

要素2：统计推断的正确性

要素3：样本外有效性与稳健性

样本外检验方法

3.5 Module 3 小结

Module 4

风险vs错误定价的判别框架

4.1 问题的核心难点

4.2 四层判别框架

第二层：Beta定价关系检验

Beta定价检验：直观例子

第三层：坏状态表现检验（关键）

坏状态检验：方法1——分区间分析

第四层：套利限制与行为偏差证据

套利限制检验方法

4.3 综合判别框架：案例应用

案例2：价值效应

4.4 ML时代的新范式

ML范式：从"假设检验"到"预测与学习"

ML与传统方法的融合前景

4.5 Module 4 小结

讲授部分总结