跳转至

研究系统顶层框架: 四条河流 → 五层知识库

一、哲学层: 四条河流认识论

张老师的"物质、金融、信息、人性"认识论是高层哲学指导,不适合直接作为知识库分类标签。 转化为可操作的映射关系:

┌──────────────────────────────────────────────────────────────┐
│                    四条河流 (认识论)                           │
├──────────┬──────────┬──────────┬──────────────────────────────┤
│ 物质河流  │ 金融河流  │ 信息河流  │ 人性暗河                    │
│ (实体供需) │ (货币定价) │ (叙事驱动) │ (行为变量)                  │
├──────────┼──────────┼──────────┼──────────────────────────────┤
│ 产能      │ 利率      │ 政策日历  │ 央行行长风格                 │
│ 库存      │ 汇率      │ 新闻情绪  │ 市场极端情绪指标             │
│ 贸易流    │ 持仓结构  │ 机构报告  │ 持仓拥挤度                   │
│ 天气/灾害 │ 资金流向  │ 市场叙事  │ 群体决策偏差                 │
│           │ 基差/月差 │           │                             │
│           │ 跨品种价差│           │                             │
└──────────┴──────────┴──────────┴──────────────────────────────┘
         ↓              ↓              ↓              ↓
    中观数据库     宏观数据库+      事件叙事库    不做单独库
                   微观定价表                    作为分析附加维度

关键原则: 人性暗河不做单独库,而是作为情景推演时的附加维度嵌入分析流程中。

二、架构层: 五层知识库骨架

┌─────────────────────────────────────────────────────────────────┐
│                     五层知识库架构                                │
├─────────────────────────────────────────────────────────────────┤
│                                                                  │
│  Layer 1: 宏观因子库                                             │
│  ─────────────────                                               │
│  - 全球货币政策 (美联储/ECB/BOJ/PBOC利率路径)                      │
│  - 汇率体系 (美元指数、人民币、卢布)                               │
│  - 经济周期 (GDP/PMI/工业产出/CPI)                                │
│  - 地缘政治格局 (中东/俄乌/制裁体系)                              │
│  - 通胀-利率螺旋                                                 │
│  ← 金融河流 + 信息河流的宏观部分                                  │
│                                                                  │
│  Layer 2: 产业链因子库                                            │
│  ─────────────────                                               │
│  - 上游: OPEC+产量/非OPEC产能/页岩油钻机数/投资周期               │
│  - 中游: 炼厂开工率/裂解价差/运费(VLCC/Aframax)                   │
│  - 下游: 成品油消费/化工品需求/战略储备变动                        │
│  - 库存: EIA/API/浮仓/陆上商业库存/SPR                            │
│  - 贸易流: 进出口量/航线/制裁影响的贸易再分配                      │
│  ← 物质河流                                                      │
│                                                                  │
│  Layer 3: 市场结构库                                              │
│  ─────────────────                                               │
│  - 期货曲线: 月差结构(Contango/Backwardation)                     │
│  - 持仓结构: CFTC-COT(基金净多/商业套保/散户)                     │
│  - 基差: Brent-WTI价差/SC-Brent价差/区域升贴水                    │
│  - 跨品种: 裂解价差/原油-黄金比/原油-铜比                         │
│  - 波动率: 隐含波动率/历史波动率/偏度                              │
│  - 资金流: ETF持仓/期货换手率/期权Put-Call比                       │
│  ← 金融河流的微观定价部分                                         │
│                                                                  │
│  Layer 4: 事件叙事库                                              │
│  ─────────────────                                               │
│  - 政策日历: OPEC会议/美联储议息/EIA周报/IEA月报/非农             │
│  - 突发事件: 战争/制裁/飓风/管道故障/罢工                         │
│  - 新闻情绪: 舆论主基调/恐慌指数/媒体关键词频率                    │
│  - 机构观点: 投行报告摘要/三大机构(IEA/EIA/OPEC)分歧追踪          │
│  - 叙事逻辑: 当前市场主线叙事 + 历史类比                          │
│  ← 信息河流                                                      │
│                                                                  │
│  Layer 5: 研究日志库                                              │
│  ─────────────────                                               │
│  - 每日市场快照 (价格/事件/情绪)                                  │
│  - 周度逻辑复盘 (主线是否转换)                                    │
│  - 月度策略评估 (多空判断回溯)                                    │
│  - 认知修正记录 (哪些判断错了,为什么)                             │
│  - 交易策略日志 (三周期信号/123法则触发/盈亏复盘)                  │
│  ← 所有河流的融合 + 人性暗河的反思                                │
│                                                                  │
└─────────────────────────────────────────────────────────────────┘

三、数据源映射

Layer 1 宏观因子库 - 数据来源

因子 来源 更新频率 系统模块
美联储利率/声明 FedWatch/FOMC 6周 待建
美元指数 同花顺/Wind 数值数据/宏观数据/
全球PMI 统计局/ISM 待建
CPI/通胀 BLS/统计局 待建
地缘风险指数 GPR/自建 geopolitical_risk.py

Layer 2 产业链因子库 - 数据来源

因子 来源 更新频率 系统模块
OPEC产量 OPEC月报 数值数据/1.0产业链数据/
EIA库存 EIA周报 eia_weekly.py
Baker Hughes钻机 BH网站 baker_hughes_rig.py
裂解价差 同花顺/计算 裂解-金融市场_*.xlsx
SC/原油产业链 上期所/INE 原油期货(SC)周度信息提取表.xlsx
产业链7维度 Excel集 1.0产业链数据/ (7个文件)

Layer 3 市场结构库 - 数据来源

因子 来源 更新频率 系统模块
CFTC持仓 CFTC/同花顺 同花顺-原油相关CFTC数据.xlsx
期货行情 通达信/同花顺 分钟级 数值数据/行情数据/ (1322个TXT)
月差结构 计算 待建
波动率 计算 volatility_model.py
技术形态 计算 实时 pattern_recognition.py

Layer 4 事件叙事库 - 数据来源

因子 来源 更新频率 系统模块
新闻采集 新华/金十/一财 oil_news_scraper.py
事件冲击 自动检测 event_impact_analyzer.py
机构报告 IEA/EIA/OPEC 文本数据/研究报告/ (1927篇PDF)
政策日历 手动+自动 待建
研究文档 外部文本 不定期 外部文本/ (docx/pptx)

Layer 5 研究日志库 - 数据来源

因子 来源 更新频率 系统模块
日简报 自动生成 briefings/
策略回测 三周期系统 按需 three_period_123_strategy.py
综合分析 6模块融合 按需 intelligent_analysis.py
预测记录 模型输出 models/

四、分析流水线: 河流→决策

数据采集(Bronze)  →  指标计算(Silver)  →  信号融合(Gold)  →  决策输出
     ↓                    ↓                   ↓                ↓
 L1-L4 原始数据      技术指标计算        多维度综合评分       投研简报
 新闻/行情/报告      供需平衡表          三周期信号          操作建议
                     持仓分析            事件冲击评估        风险提示
                     波动率建模          叙事主线判断

决策融合逻辑

  1. 宏观定势 (L1): 确定大周期方向(年度级别多空)
  2. 产业验证 (L2): 供需基本面是否支撑宏观判断
  3. 结构确认 (L3): 资金/持仓/曲线是否共振
  4. 事件催化 (L4): 等待催化事件触发入场
  5. 执行记录 (L5): 三周期择时 + 123法则入场 + 复盘

人性暗河的嵌入点

人性暗河不独立存储,而是在以下环节作为附加维度:

  • 情绪极端检测: 当VIX/Put-Call比/新闻情绪达到极值时,自动触发"反人性"提示
  • 持仓拥挤度: CFTC基金净多创历史极值时,警示回调风险
  • 决策者行为建模: 已知的央行行长/OPEC秘书长决策风格,纳入事件影响评估
  • 自我纠偏: 研究日志中强制记录"当前最大盲点是什么"

五、当前市场快照 (2026-05-07)

物质河流 (供需实况)

维度 当前状态 变化方向
OPEC产量 3月暴跌788万桶/日至2079万桶/日(战争影响) 5月计划增产20.6万桶/日
霍尔木兹海峡 通航严重受阻,VLCC刚恢复试通行 仅20%高管认为5月恢复正常
EIA库存 4月24日当周+192.5万桶(超预期累库) 连续累库趋势
5月6日EIA -231.3万桶(意外去库) 单次数据
IEA需求预测 2026年需求首次萎缩(-8万桶/日) 6年来最悲观
全球供应盈余 IEA预计供过于求41万桶/日 中期利空

金融河流 (定价环境)

维度 当前状态 含义
WTI (5/7) 93-95美元区间(前日跌7%) 地缘溢价快速退潮
Brent 跌破100美元(前日跌7.8%) 从126高点回落20%+
SC原油主连 640-653元(日内跌超6%) 跟随外盘剧烈调整
美元指数 98.50附近震荡 中性偏强
美联储 2026年降息预期全面排除 油价通胀→利率冻结
月差结构 深度Backwardation 近月供应仍紧

信息河流 (叙事转换)

叙事 状态 市场影响
美伊停火 (5/6-7最大事件) 美方认为"接近达成一页纸备忘录" 油价暴跌7%+触发因素
伊朗外长访华 中方斡旋,多方外交活跃 增强停火预期
OPEC+5月增产 已执行+20.6万桶/日 边际供应增加
IEA vs OPEC分歧 IEA大幅看空 vs OPEC维持乐观 市场困惑加剧
美国制裁扩大 恒力石化等中国企业被列入 贸易流重组

当前主线叙事转换: 从"战争溢价+供应恐慌"(4月) → "停火预期+溢价退潮"(5月初)

人性暗河 (行为维度)

  • 市场情绪: 4月底极度恐慌(Brent冲126) → 5月初突然转为乐观(暴跌),情绪钟摆
  • 持仓拥挤: 前期多头拥挤,5/6-7日可能触发止损踩踏
  • 群体行为: "每一条新闻都在推高价格"的正反馈循环刚刚被打破
  • 决策者风格: 特朗普"交易型外交" — 谈判随时可能反转

六、框架与系统模块对应关系

concepts/research-framework.md     ← 本文件 (顶层设计)
concepts/knowledge-base-manual.md  ← 知识库操作手册 (九条铁律)
concepts/trading-core.md           ← 交易内核 (执行层)
concepts/crude-oil-industry-chain.md ← 产业链维度 (L2细化)
concepts/data-collection-methodology.md ← 数据采集方法论

scrapers/intelligent_analysis.py   ← 五层融合入口
scrapers/supply_demand_model.py    ← L2 供需分析
scrapers/event_impact_analyzer.py  ← L4 事件冲击
scrapers/volatility_model.py       ← L3 波动率
scrapers/trend_identifier.py       ← L3 趋势识别
scrapers/three_period_123_strategy.py ← L5 策略执行+记录
scrapers/oil_news_scraper.py       ← L4 新闻采集
scrapers/geopolitical_risk.py      ← L1 地缘风险

models/                            ← L5 研究日志存储
briefings/                         ← 决策输出

七、待建设模块清单

按五层知识库缺口分析:

层级 缺口 建设优先级 依赖数据
L1 宏观因子自动采集(Fed/PMI/CPI) API/爬虫
L1 美元-原油关联模型 宏观数据/
L2 产业链Excel自动入库+更新 1.0产业链数据/
L2 裂解价差实时计算 裂解-金融市场.xlsx
L3 CFTC持仓分析模块 同花顺-CFTC.xlsx
L3 月差结构监控 行情数据/
L4 1927篇PDF解析入库 文本数据/研究报告/
L4 政策日历自动提醒 手动维护
L5 每日自动快照生成 全层数据
L5 策略信号实时监控 行情数据实时