<center> Week 1 大语言模型与金融AI Agent </center>

金融工程 = 金融（问题） + 工程（方法）

是创新性金融技术和金融工具的创造性应用，它用工程思维解决具体的金融问题

金融工程是技术驱动的
金融工程是天生的交叉学科
金融工程始终关注新技术

核心问题	原理与方法
资产定价组合管理/优化风险管理	合成与复制无套利动态过程风险中性

金融工程的作用

微观：通过创造性的方案更好地满足客户的金融需求
宏观：提高金融资源配置效率

Scientists	Engineers
understand things	Build thing
observe the world	seek to change the world
very theoretical	more practical
embrace ambiguity	often frustrated by it
work free	work hard

Source: Lo, Andrew W.. “Robert C. Merton: The First Financial Engineer.” Review of Financial Economics 12 (2020): 1-18.

本课程定位与路线图

Week 1: LLM与AI Agent → 技术基础
Week 2: 机器学习 → 技术基础
Week 3: 深度学习+强化学习 → 技术基础
Week 4: 大数据分析 → 技术基础
Week 5: 量化交易 → 专题应用
Week 6: 风险管理 → 专题应用
Week 7: 产品设计 → 专题应用
Week 8: Hackathon + 前沿 → 综合实战

本课程关注新技术如何重塑金融工程的三个核心领域：

技术基础：LLM、ML、深度学习、大数据
专题应用：交易、风险管理、产品设计
前沿融合：AI Agent与金融工程的深度融合

重点：不是孤立地讲技术，而是将技术嵌入金融工程问题求解。

1950s-1960s \| 现代金融理论奠基	1970s \| 定价革命	1980s \| 数值方法深化
Markowitz (1952): 投资组合选择理论 → 均值-方差框架 Modigliani & Miller (1958): MM定理 → 公司资本结构无关论 Sharpe (1964), Lintner (1965), Mossin (1966): CAPM Fama (1970): 有效市场假说(EMH)	Black & Scholes (1973), Merton (1973): 期权定价公式 Ross (1976): 套利定价理论(APT) Cox, Ross & Rubinstein (1979): 二叉树期权定价	蒙特卡洛模拟在金融中的应用有限差分法求解偏微分方程利率模型: Vasicek, CIR, Hull-White

1990s \| 风险管理时代	2000s \| 量化交易时代	2010s-2020s \| AI时代
J.P. Morgan (1994): RiskMetrics → VaR成为行业标准 CreditMetrics, KMV模型长期资本管理公司(LTCM) 1998年崩溃信用衍生品(CDS)市场爆发	电子通信网络(ECN)兴起高频交易(HFT)占比超过50% 统计套利、因子投资流行 2008年金融危机 → 监管变革(Dodd-Frank)	Machine Learning + Big Data 全面渗透 2017: Transformer架构诞生 2022+: ChatGPT引爆LLM革命 2024-2025: AI Agent 自主交易系统

模型	参数	训练数据	关键创新	发布时间
GPT-1	117M	BookCorpus	生成式预训练	2018.06
GPT-2	1.5B	WebText	Zero-shot能力涌现	2019.02
GPT-3	175B	Common Crawl	In-context learning	2020.05
GPT-3.5	175B	Code+Text	RLHF, Instruction Tuning	2022.03
GPT-4	~1.8T*	多模态数据	多模态, 更强推理	2023.03
GPT-4o	~1.8T*	多模态数据	全模态实时交互	2024.05

模型	开发方	参数量	金融工程适用场景
GPT-5.4	OpenAI	未公开（官方未披露参数量；强调最高可达 1M 上下文）	复杂数学推理 + 量化代码生成、长链路策略/回测方案整理、Agent化的“分析-验证-交付”工作流
Claude Opus 4.6	Anthropic	未公开（Anthropic 不披露参数量）	长文档财报/研报的结构化抽取、合规/风控口径推导、严谨推理与“可审计”输出风格
Claude Sonnet 4	Anthropic	未公开（官方未披露参数量；定位为更均衡的能力档）	高频代码/规则生成、偏工程化的金融工具调用编排、需要更低延迟的推理与文书辅助
Grok-4	xAI	MoE 量级约 1.7T 参数（公开资料口径）	需要结合实时信息/检索的市场解读、事件驱动的结构化分析、面向交易/风控的快速迭代原型
Gemini 3.1 Pro	Google/DeepMind	未公开（公开资料未披露参数量）	金融图表/多模态理解、与 Google 生态（如工作流、表格）相关的分析与交付；多源证据整合

模型	开发方	参数量	金融工程适用场景
GLM-5.1	Z.AI	约 754B 参数（公开资料口径）	长上下文的策略推导、量化研究叙事与代码落地、面向“较长期限/较复杂约束”的规划型任务
MiniMax-2.7	MiniMax	约 230B 参数（公开资料口径）	工程交付/代码生成、批量报表处理逻辑、偏“工具链编排”的金融软件开发辅助
Kimi-2.6	Moonshot AI	MoE：约 1T 总参数、激活约 32B（公开资料口径）	中文长文档理解、研报/公告的结构化抽取、用于回测数据口径梳理与一致性检查
MiMo（MiMo-V2-Pro）	小米	MoE：总参数约 1T+、激活约 42B（公开资料口径）	面向 Agent/工具调用的金融工作流编排、长上下文多步任务（尽调/研究/交付）与代码化输出
Qwen 3 max	阿里巴巴	超过 1T 参数（公开资料口径）	复杂中文指令下的代码与表格/脚本生成、量化研究的多轮推导、对齐“可复现实验”的脚本输出
DeepSeek v4	DeepSeek	MoE：总参数约 1.6T，推理激活约 49B（公开资料口径）	金融数学推理（期权/定价/推导）、需要高质量推理的策略验证、开源生态中可复用的研究范式

1. 明确具体 (Specific)	2. 提供上下文 (Contextual)	3. 指定输出格式 (Structured)
"分析这个股票"	"写一个移动平均线策略"	"有哪些风险？"
"分析腾讯控股(0700.HK)2024年Q4财报，重点关注：营收增长率、毛利率变化、回购计划，用中文回答"	"你是一个量化交易研究员。请用Python实现一个双均线交叉策略：快线5日，慢线20日，在回测框架Backtrader中实现"	"请用以下JSON格式输出分析结果：{'风险类型': str, '风险等级': '高/中/低', '缓释措施': list[str]}"

策略	方法	优点	缺点	适用场景
固定大小分块	按字符/token数切分	简单统一	可能切断语义	通用文档
递归分块	按段落 → 句子层级	语义完整	块大小不统一	结构化文档
语义分块	按语义边界切分	语义完整	需要额外模型	高质量需求
滑动窗口	重叠分块	信息不丢失	数据冗余	关键信息密集

维度	本地部署	API调用
数据安全	数据不出本地	数据需上传
延迟	无网络延迟	依赖网络
成本	一次性硬件	按量付费
模型能力	开源模型(LLaMA, Qwen等)	闭源顶尖(GPT-4, Claude)
维护成本	需要自行维护	服务商维护
定制化	可微调	有限定制

框架	部署难度	性能	金融特性	最佳场景
Ollama	极简	良好	一键部署、本地私有	个人投研、课程项目
vLLM	中等	极佳	企业级高性能推理	机构量化分析、高频处理
LangChain	中等	良好	多源数据链接、工具调用	复杂金融应用、RAG系统
FastChat	简单	良好	OpenAI接口兼容	量化交易API、研究原型
FinNLP	中等	良好	金融NLP专用、财报处理	财经文本分析、舆情监控

特性	vLLM	LangChain	FastChat	FinNLP
一键部署		△	△
量化支持		△
金融API集成	△		△
数据隐私保护
多模型协作	△			△
金融知识增强

参数	范围	默认值	作用
Temperature	0.0-2.0	0.7	控制随机性/创造性
Top_p (核采样)	0.0-1.0	0.9	累积概率阈值
Top_k	0-100	50	限制候选词数量
Presence Penalty	-2.0-2.0	0.0	抑制已出现内容
Frequency Penalty	-2.0-2.0	0.0	抑制高频词
Max Tokens	1-∞	模型相关	限制生成长度

场景	Temperature	Top_p	Max_tokens	说明
金融分析/问答	0.1-0.3	0.8	1000-2000	低随机性，高准确性
代码生成	0.0-0.2	0.9	2000-4000	确定性输出
产品说明书/报告	0.3-0.5	0.9	2000-4000	适度创造性
情景分析/头脑风暴	0.6-0.8	0.95	1500-3000	高多样性
合规审查	0.0-0.1	0.8	1000-2000	严格一致性

模型	参数量	金融专长	硬件需求
Qwen2.5	7B-72B	通用强	7B: 8GB VRAM
LLaMA 3.1	8B-70B	英文强	8B: 8GB VRAM
Mistral	7B-8x22B	推理强	7B: 8GB VRAM
DeepSeek-Coder	6.7B-33B	代码强	6.7B: 8GB VRAM
FinMA	7B-30B	金融专用	7B: 8GB VRAM
BLOOM	7.1B-176B	多语言	7.1B: 8GB VRAM

Chain	特点	金融应用
LLMChain	单次LLM调用	简单分析
SequentialChain	多步骤串联，前一步输出→后一步输入	分析→信号→决策
RouterChain	根据输入路由到不同Chain	不同市场状态→不同策略
MapReduceChain	并行处理→汇总	批量研报分析
ConversationChain	多轮对话+记忆	投资顾问对话

Week 1 大语言模型与金融AI Agent

LLMs & Financial AI Agents

本周内容概览

1.1 金融工程发展史

从MM定理到AI Agent

金融工程发展历程(学术创新)

金融工程发展历程(实践创新)

金融工程的核心驱动力

金融工程 = 金融（问题） + 工程（方法）

本课程定位与路线图

LLMs对劳动力市场的影响：OpenAI

LLMs对劳动力市场的影响：Anthropic

讨论

1.2 大语言模型基础

Transformer架构与GPT系列

基础架构与核心原理

1. 基础架构

2. 核心技术原理

Transformer架构概览

注意力机制(Attention)详解

Multi-Head Attention

Transformer的关键组件

从GPT-1到GPT-4：能力跃迁

LLM的关键能力涌现

大模型的局限性

主流LLM模型对比：国际模型

主流LLM模型对比：国内模型

模型选用建议

LLM在金融工程中的应用框架

1.3 提示工程

Prompt Engineering for Finance

提示工程核心原则

Few-shot提示与In-Context Learning

Chain-of-Thought (CoT) 推理

ReAct模式：推理+行动

渐进式提示优化案例

金融场景Prompt模板

结构化输出控制

1.4 RAG技术

Retrieval-Augmented Generation

RAG架构

文档分块策略

Embedding模型与向量数据库

RAG检索增强策略

金融RAG应用案例

1.5 Multi-Agent框架

多智能体协作系统

从单Agent到多Agent

TradingAgents框架 (GitHub 51.4k★)

TradingAgents工作流程

AutoGen框架 (微软)

LLM工具调用机制

1.6 Obsidian + Claude Code

个人知识库搭建

为什么金融工程师需要个人知识库？

Obsidian核心特性

Claude Code与Obsidian的集成

金融工程知识库结构

关键笔记模板：论文阅读笔记模板

关键笔记模板：策略研究笔记模板

Claude Code辅助知识管理实操

知识管理最佳实践

课堂实践：搭建个人知识库

1.7 LLM本地部署

Local LLM Deployment

本地部署 vs API调用

Ollama框架

部署框架功能对比

LLM参数调优指南

开源模型选择（金融场景）

LangChain集成

LangChain核心组件

LangChain Chain类型与金融应用

1.8 实践环节

Hands-on Practice

实践1：环境搭建 (20min)

实践2：基础LLM调用 (20min)

实践3：金融信息检索Agent (40min)

实践4：搭建Obsidian知识库入口 (10min)

本周总结