|
Panel A: Size–B/M portfolios
Panel B: Size–OP portfolios
suorce: FF5 Table 1 |
方法范式 | 典型做法 | 适用/优点 | 风险/防御 |
---|---|---|---|
理论驱动 | 先立经济直觉(风险/行为), 再写口径并预注册假设 |
样本短或执行受限;可解释、可投资性好 | 叙事贴合显著性偏误 → 设定 OOS 留出、前置假设 |
经验复制 | 复现实证经典(Value/Mom/Quality/LowVol), 校准口径 |
基准与教学; 可比性强 |
口径不一致、后发表衰减 → 对齐定义、做样本外 |
统计/线性 | 橫截面回归、LASSO/Ridge、 PCA、逐步特征选择 |
特征多、结构近线性;可解释 | 数据窥探 → 滚动/嵌套交叉验证、信息系数跟踪 |
机器学习/非线性 | 树、Boosting、Random Forest、XGBoost、浅层 NN、Stacking | 非线性/交互强、特征多 | 黑箱/过拟合/泄露 → 滚动 OOS、时间分块 CV、特征重要性与稳定性 |
替代数据 | 文本/舆情、供应链、卫星、网页抓取 | 新维度、潜在先手 | 噪声高/合规与可复制性弱 → 审计数据来源、版本锁定 |
事件/微观结构 | 公告、回购、限售解禁、交易成本/深度/价差 | 明确催化、短期信号 | 执行摩擦、容量受限 → 成本/冲击建模、容量敏感性 |
|
|
1) 数据与宇宙治理(PIT)
|
2) 原始特征定义(仅用
|
3) 横截面去极值(Winsorize/分位)
4) 方向统一(越大越好)
|
5) 横截面标准化(行业/国家内)
|
6) 可选中性化(行业/规模/β/风格)
|
7) 合成/加权(多描述子、多周期、去冗余)
|
8) 得分→alpha(缩放与衰减)
|
9) 组合构建(排序/倾斜/优化)
|
10) 成本与容量建模(内生化)
|
11) 再平衡与执行(缓冲/算法/TCA)
|
行业共识
各机构特点
维度 | AQR / Man / BlackRock | MSCI / Scientific Beta | WorldQuant | DFA |
---|---|---|---|---|
数据治理 | PIT + 风险模型 + 跨市 QC | 规则化可投资宇宙 | 广覆盖 + 自动 QC | 广覆盖至小盘 + 容量边界 |
特征定义 | 少而精,多描述子,轻量 ML | 公开规则化描述子 | 海量短公式 alpha | Size/Value/Profit 倾斜 |
去极值/标准化 | 分位 + 行业内 z/秩 | 方法学明确口径 | 多用秩/分位 | 保守处理 |
中性化 | 强(行业/β/规模/风格) | 行业内 + 组合层带 | 广泛残差化 | 弱中性,保留弹性 |
合成 | 稳健配权 + 多周期 | 等权/固定权;多策略池 | 去相关 + 组合器 | 连续倾斜函数 |
α/衰减 | 波动/特质缩放 + 半衰期 | 排序/加权为主 | 强衰减 + 去相关 | 不显式 α |
组合构建 | 优化器一体化( |
排序/倾斜/多策略 | 组合器 + 优化器 | 倾斜 + 缓冲 + 替代 |
成本/容量 | 内生 + TCA 闭环 | 低频 + 缓冲 + 上限 | 内生 + 参数网格 | 耐心交易 + 税务 |
再平衡/执行 | 连续/分层 + 算法 | 固定重构 + 缓冲 | 连续 + 组合器 | 连续 + 税损/借贷 |
风险/压力 | 全链路 + 情景库 | TE/行业/国家模板 | β/杠杆/借券 | 税后/长期回撤 |
评估/生命周期 | 三视角 + OOS/拥挤/TCA | 暴露达标 + 复制性 | IC 管线 + 新颖度 | 税后实现度 |
|
|
- 课程:玩转 Python 量化交易(通识·8学时) - 讲次定位:理论与方法 + Excel/Sheets 全流程演示 - 受众:无先修、非金融专业同学
.footnote[对齐行业共识:MSCI、Robeco、NEPC、《因子投资:方法与实践》、Paleologo]
--- ### 议程与时间(120 min) 1. 理论基础与行业共识(25') 2. 方法论 Canvas 与治理(10') 3. 表格演示:因子工程与合成(25') 4. 表格演示:组合构建与评估(25') 5. 小组实操(20') 6. 展示与总结(15')
.footnote[每页 2–3 分钟,现场答疑留 5–10 分钟机动]
### 行业发展时间线(速览) - 1960s:CAPM(Sharpe, Lintner) - 1992/1993:Fama–French 三因子(Value/Size) - 1997:Carhart 动量(四因子) - 2014–2015:BAB(Betting Against Beta),FF 五因子(Prof/Investment),QMJ(质量) - 2010s:Smart Beta/多因子指数与 ETF 扩张 - 2016–至今:因子“动物园”与复现危机、拥挤与容量管理 - 2020s:ML 与多源数据融合,治理与可投资性成为共识 .footnote[启示:择时难,多因子分散更稳健;强调成本、容量与治理。]
.footnote[课堂建议聚焦“理论驱动 + 经验复制 + 轻量统计”,将 ML/替代数据留到第4讲展开。] .footnote[防御要点:一次只动 1–2 个“旋钮”;负结果也记录;治理与透明优先于“漂亮数字”。]