研究系统顶层框架: 四条河流 → 五层知识库
一、哲学层: 四条河流认识论
张老师的"物质、金融、信息、人性"认识论是高层哲学指导,不适合直接作为知识库分类标签。
转化为可操作的映射关系:
┌──────────────────────────────────────────────────────────────┐
│ 四条河流 (认识论) │
├──────────┬──────────┬──────────┬──────────────────────────────┤
│ 物质河流 │ 金融河流 │ 信息河流 │ 人性暗河 │
│ (实体供需) │ (货币定价) │ (叙事驱动) │ (行为变量) │
├──────────┼──────────┼──────────┼──────────────────────────────┤
│ 产能 │ 利率 │ 政策日历 │ 央行行长风格 │
│ 库存 │ 汇率 │ 新闻情绪 │ 市场极端情绪指标 │
│ 贸易流 │ 持仓结构 │ 机构报告 │ 持仓拥挤度 │
│ 天气/灾害 │ 资金流向 │ 市场叙事 │ 群体决策偏差 │
│ │ 基差/月差 │ │ │
│ │ 跨品种价差│ │ │
└──────────┴──────────┴──────────┴──────────────────────────────┘
↓ ↓ ↓ ↓
中观数据库 宏观数据库+ 事件叙事库 不做单独库
微观定价表 作为分析附加维度
关键原则: 人性暗河不做单独库,而是作为情景推演时的附加维度嵌入分析流程中。
二、架构层: 五层知识库骨架
┌─────────────────────────────────────────────────────────────────┐
│ 五层知识库架构 │
├─────────────────────────────────────────────────────────────────┤
│ │
│ Layer 1: 宏观因子库 │
│ ───────────────── │
│ - 全球货币政策 (美联储/ECB/BOJ/PBOC利率路径) │
│ - 汇率体系 (美元指数、人民币、卢布) │
│ - 经济周期 (GDP/PMI/工业产出/CPI) │
│ - 地缘政治格局 (中东/俄乌/制裁体系) │
│ - 通胀-利率螺旋 │
│ ← 金融河流 + 信息河流的宏观部分 │
│ │
│ Layer 2: 产业链因子库 │
│ ───────────────── │
│ - 上游: OPEC+产量/非OPEC产能/页岩油钻机数/投资周期 │
│ - 中游: 炼厂开工率/裂解价差/运费(VLCC/Aframax) │
│ - 下游: 成品油消费/化工品需求/战略储备变动 │
│ - 库存: EIA/API/浮仓/陆上商业库存/SPR │
│ - 贸易流: 进出口量/航线/制裁影响的贸易再分配 │
│ ← 物质河流 │
│ │
│ Layer 3: 市场结构库 │
│ ───────────────── │
│ - 期货曲线: 月差结构(Contango/Backwardation) │
│ - 持仓结构: CFTC-COT(基金净多/商业套保/散户) │
│ - 基差: Brent-WTI价差/SC-Brent价差/区域升贴水 │
│ - 跨品种: 裂解价差/原油-黄金比/原油-铜比 │
│ - 波动率: 隐含波动率/历史波动率/偏度 │
│ - 资金流: ETF持仓/期货换手率/期权Put-Call比 │
│ ← 金融河流的微观定价部分 │
│ │
│ Layer 4: 事件叙事库 │
│ ───────────────── │
│ - 政策日历: OPEC会议/美联储议息/EIA周报/IEA月报/非农 │
│ - 突发事件: 战争/制裁/飓风/管道故障/罢工 │
│ - 新闻情绪: 舆论主基调/恐慌指数/媒体关键词频率 │
│ - 机构观点: 投行报告摘要/三大机构(IEA/EIA/OPEC)分歧追踪 │
│ - 叙事逻辑: 当前市场主线叙事 + 历史类比 │
│ ← 信息河流 │
│ │
│ Layer 5: 研究日志库 │
│ ───────────────── │
│ - 每日市场快照 (价格/事件/情绪) │
│ - 周度逻辑复盘 (主线是否转换) │
│ - 月度策略评估 (多空判断回溯) │
│ - 认知修正记录 (哪些判断错了,为什么) │
│ - 交易策略日志 (三周期信号/123法则触发/盈亏复盘) │
│ ← 所有河流的融合 + 人性暗河的反思 │
│ │
└─────────────────────────────────────────────────────────────────┘
三、数据源映射
Layer 1 宏观因子库 - 数据来源
| 因子 |
来源 |
更新频率 |
系统模块 |
| 美联储利率/声明 |
FedWatch/FOMC |
6周 |
待建 |
| 美元指数 |
同花顺/Wind |
日 |
数值数据/宏观数据/ |
| 全球PMI |
统计局/ISM |
月 |
待建 |
| CPI/通胀 |
BLS/统计局 |
月 |
待建 |
| 地缘风险指数 |
GPR/自建 |
日 |
geopolitical_risk.py |
Layer 2 产业链因子库 - 数据来源
| 因子 |
来源 |
更新频率 |
系统模块 |
| OPEC产量 |
OPEC月报 |
月 |
数值数据/1.0产业链数据/ |
| EIA库存 |
EIA周报 |
周 |
eia_weekly.py |
| Baker Hughes钻机 |
BH网站 |
周 |
baker_hughes_rig.py |
| 裂解价差 |
同花顺/计算 |
日 |
裂解-金融市场_*.xlsx |
| SC/原油产业链 |
上期所/INE |
日 |
原油期货(SC)周度信息提取表.xlsx |
| 产业链7维度 |
Excel集 |
月 |
1.0产业链数据/ (7个文件) |
Layer 3 市场结构库 - 数据来源
| 因子 |
来源 |
更新频率 |
系统模块 |
| CFTC持仓 |
CFTC/同花顺 |
周 |
同花顺-原油相关CFTC数据.xlsx |
| 期货行情 |
通达信/同花顺 |
分钟级 |
数值数据/行情数据/ (1322个TXT) |
| 月差结构 |
计算 |
日 |
待建 |
| 波动率 |
计算 |
日 |
volatility_model.py |
| 技术形态 |
计算 |
实时 |
pattern_recognition.py |
Layer 4 事件叙事库 - 数据来源
| 因子 |
来源 |
更新频率 |
系统模块 |
| 新闻采集 |
新华/金十/一财 |
日 |
oil_news_scraper.py |
| 事件冲击 |
自动检测 |
日 |
event_impact_analyzer.py |
| 机构报告 |
IEA/EIA/OPEC |
月 |
文本数据/研究报告/ (1927篇PDF) |
| 政策日历 |
手动+自动 |
周 |
待建 |
| 研究文档 |
外部文本 |
不定期 |
外部文本/ (docx/pptx) |
Layer 5 研究日志库 - 数据来源
| 因子 |
来源 |
更新频率 |
系统模块 |
| 日简报 |
自动生成 |
日 |
briefings/ |
| 策略回测 |
三周期系统 |
按需 |
three_period_123_strategy.py |
| 综合分析 |
6模块融合 |
按需 |
intelligent_analysis.py |
| 预测记录 |
模型输出 |
日 |
models/ |
四、分析流水线: 河流→决策
数据采集(Bronze) → 指标计算(Silver) → 信号融合(Gold) → 决策输出
↓ ↓ ↓ ↓
L1-L4 原始数据 技术指标计算 多维度综合评分 投研简报
新闻/行情/报告 供需平衡表 三周期信号 操作建议
持仓分析 事件冲击评估 风险提示
波动率建模 叙事主线判断
决策融合逻辑
- 宏观定势 (L1): 确定大周期方向(年度级别多空)
- 产业验证 (L2): 供需基本面是否支撑宏观判断
- 结构确认 (L3): 资金/持仓/曲线是否共振
- 事件催化 (L4): 等待催化事件触发入场
- 执行记录 (L5): 三周期择时 + 123法则入场 + 复盘
人性暗河的嵌入点
人性暗河不独立存储,而是在以下环节作为附加维度:
- 情绪极端检测: 当VIX/Put-Call比/新闻情绪达到极值时,自动触发"反人性"提示
- 持仓拥挤度: CFTC基金净多创历史极值时,警示回调风险
- 决策者行为建模: 已知的央行行长/OPEC秘书长决策风格,纳入事件影响评估
- 自我纠偏: 研究日志中强制记录"当前最大盲点是什么"
五、当前市场快照 (2026-05-07)
物质河流 (供需实况)
| 维度 |
当前状态 |
变化方向 |
| OPEC产量 |
3月暴跌788万桶/日至2079万桶/日(战争影响) |
5月计划增产20.6万桶/日 |
| 霍尔木兹海峡 |
通航严重受阻,VLCC刚恢复试通行 |
仅20%高管认为5月恢复正常 |
| EIA库存 |
4月24日当周+192.5万桶(超预期累库) |
连续累库趋势 |
| 5月6日EIA |
-231.3万桶(意外去库) |
单次数据 |
| IEA需求预测 |
2026年需求首次萎缩(-8万桶/日) |
6年来最悲观 |
| 全球供应盈余 |
IEA预计供过于求41万桶/日 |
中期利空 |
金融河流 (定价环境)
| 维度 |
当前状态 |
含义 |
| WTI (5/7) |
93-95美元区间(前日跌7%) |
地缘溢价快速退潮 |
| Brent |
跌破100美元(前日跌7.8%) |
从126高点回落20%+ |
| SC原油主连 |
640-653元(日内跌超6%) |
跟随外盘剧烈调整 |
| 美元指数 |
98.50附近震荡 |
中性偏强 |
| 美联储 |
2026年降息预期全面排除 |
油价通胀→利率冻结 |
| 月差结构 |
深度Backwardation |
近月供应仍紧 |
信息河流 (叙事转换)
| 叙事 |
状态 |
市场影响 |
| 美伊停火 (5/6-7最大事件) |
美方认为"接近达成一页纸备忘录" |
油价暴跌7%+触发因素 |
| 伊朗外长访华 |
中方斡旋,多方外交活跃 |
增强停火预期 |
| OPEC+5月增产 |
已执行+20.6万桶/日 |
边际供应增加 |
| IEA vs OPEC分歧 |
IEA大幅看空 vs OPEC维持乐观 |
市场困惑加剧 |
| 美国制裁扩大 |
恒力石化等中国企业被列入 |
贸易流重组 |
当前主线叙事转换: 从"战争溢价+供应恐慌"(4月) → "停火预期+溢价退潮"(5月初)
人性暗河 (行为维度)
- 市场情绪: 4月底极度恐慌(Brent冲126) → 5月初突然转为乐观(暴跌),情绪钟摆
- 持仓拥挤: 前期多头拥挤,5/6-7日可能触发止损踩踏
- 群体行为: "每一条新闻都在推高价格"的正反馈循环刚刚被打破
- 决策者风格: 特朗普"交易型外交" — 谈判随时可能反转
六、框架与系统模块对应关系
concepts/research-framework.md ← 本文件 (顶层设计)
concepts/knowledge-base-manual.md ← 知识库操作手册 (九条铁律)
concepts/trading-core.md ← 交易内核 (执行层)
concepts/crude-oil-industry-chain.md ← 产业链维度 (L2细化)
concepts/data-collection-methodology.md ← 数据采集方法论
scrapers/intelligent_analysis.py ← 五层融合入口
scrapers/supply_demand_model.py ← L2 供需分析
scrapers/event_impact_analyzer.py ← L4 事件冲击
scrapers/volatility_model.py ← L3 波动率
scrapers/trend_identifier.py ← L3 趋势识别
scrapers/three_period_123_strategy.py ← L5 策略执行+记录
scrapers/oil_news_scraper.py ← L4 新闻采集
scrapers/geopolitical_risk.py ← L1 地缘风险
models/ ← L5 研究日志存储
briefings/ ← 决策输出
七、待建设模块清单
按五层知识库缺口分析:
| 层级 |
缺口 |
建设优先级 |
依赖数据 |
| L1 |
宏观因子自动采集(Fed/PMI/CPI) |
中 |
API/爬虫 |
| L1 |
美元-原油关联模型 |
中 |
宏观数据/ |
| L2 |
产业链Excel自动入库+更新 |
高 |
1.0产业链数据/ |
| L2 |
裂解价差实时计算 |
高 |
裂解-金融市场.xlsx |
| L3 |
CFTC持仓分析模块 |
高 |
同花顺-CFTC.xlsx |
| L3 |
月差结构监控 |
中 |
行情数据/ |
| L4 |
1927篇PDF解析入库 |
高 |
文本数据/研究报告/ |
| L4 |
政策日历自动提醒 |
中 |
手动维护 |
| L5 |
每日自动快照生成 |
高 |
全层数据 |
| L5 |
策略信号实时监控 |
中 |
行情数据实时 |