知识库操作手册¶
本文件定义知识库运行的强制规则。所有模块的数据写入、分析输出、策略推演均须遵循以下九条铁律。 违反任何一条的输出将被标记为"不合规"并禁止进入下游决策流程。
铁律一: 无数据不推论¶
任何结论必须附上数据来源、时间、置信度标签。
置信度标签体系¶
| 标签 | 含义 | 使用条件 | 后续要求 |
|---|---|---|---|
[确认] |
数据已获多源交叉验证 | >=2个独立来源一致 | 可直接用于决策 |
[交叉验证] |
数据获2个来源部分验证 | 核心数字吻合,细节有差异 | 注明差异点 |
[单一来源] |
仅有一个数据来源 | 可靠来源但无法交叉 | 48h内补充验证 |
[待验证] |
数据需要进一步确认 | 信源可靠性未知或时效存疑 | 禁止用于决策 |
[疑似伪信息] |
有迹象表明数据不可靠 | 与已知事实矛盾 | 标红警告,隔离处理 |
执行格式¶
结论: OPEC 3月减产幅度超预期
数据: OPEC月报(2026-04-15) 显示产量2079万桶/日,环比-788万桶/日
置信度: [交叉验证] — OPEC官方+路透调查数据吻合
禁止: 出现"市场普遍认为"、"据悉"、"可能"等无数据支撑的推论进入正式结论区。
铁律二: 历史先于预测¶
先构建历史情景库,再做情景推演。
操作流程¶
- 识别当前宏观-产业组合特征
- 当前处于什么货币周期? (加息/暂停/降息)
- 当前供需格局? (过剩/平衡/短缺)
-
当前地缘态势? (和平/紧张/战争)
-
检索历史类比
- 从历史情景库中找到>=3个特征相似的时期
-
记录当时的价格表现、持续时间、触发转折的因素
-
差异分析
- 当前与历史类比的关键差异是什么?
-
这些差异会放大还是削弱历史规律?
-
情景推演
- 基于历史参照 + 差异修正,给出2-3个情景路径
- 每个路径附概率权重和关键变量
历史情景库格式¶
scenario_id: "2022-Q1-RUS-UKR"
宏观环境: 加息周期初期, 美元走强
产业格局: 供应中断(俄油制裁), 需求恢复期
地缘态势: 战争爆发
价格表现: Brent从78→128美元(+64%), 持续3个月
转折因素: SPR释放 + 需求走弱预期
铁律三: 价格表达优先¶
市场已计价了什么是判断的关键锚。基本面推演必须与价格结构互验。
价格结构三要素¶
| 维度 | 指标 | 含义 |
|---|---|---|
| 基差 | Brent-WTI, SC-Brent, 现货-期货 | 区域供需强弱 |
| 月差 | 近月-远月(Contango/Back) | 当前紧张/宽松程度 |
| 波动率 | IV/HV, 偏度, 期限结构 | 市场对不确定性的定价 |
互验规则¶
IF 基本面推演="供应紧张" AND 月差=Contango:
→ 矛盾! 价格结构不支持,需重新检查推演前提
→ 可能原因: 需求端恶化尚未纳入考量
IF 基本面推演="需求走弱" AND 月差=深度Back:
→ 矛盾! 近月定价显示当前仍紧
→ 可能原因: 供应端受限(如海峡封锁)掩盖了需求问题
原则: 当基本面推演与价格结构矛盾时,优先信任价格结构,然后回查推演逻辑。
铁律四: 机制而非结论¶
沉淀研究员的分析逻辑与矛盾识别框架,而非简单记录"看多/看空"。
禁止的记录方式¶
❌ "看多原油,目标100美元"
❌ "利空出尽,短期反弹"
❌ "预计下周上涨"
正确的记录方式¶
✓ 分析逻辑链:
前提1: 霍尔木兹通航受阻 → 供应减少X万桶/日
前提2: OPEC增产20.6万桶/日 → 部分补偿
前提3: IEA预计需求下降8万桶/日
矛盾点: 供应减少远大于增产+需求下降之和,
但价格已从126跌至95(下跌24%)
待解答: 价格下跌是计入了停火预期,还是需求恶化超预期?
验证方法: 若停火落地且价格不反弹→需求问题为主驱动
矛盾识别模板¶
矛盾编号: C-2026-05-001
描述: IEA需求首次萎缩预测 vs OPEC维持增长预测(差距150万桶/日)
可能解释:
- IEA纳入了战争对经济的二阶影响
- OPEC有政治动机维持乐观
- 真实需求介于两者之间
验证信号: 关注Q2实际炼厂开工率和成品油库存
铁律五: 可验证推演¶
每个推演必须附带"证实信号"和"证伪信号",并记录后续验证结果。
推演记录格式¶
推演编号: F-2026-05-001
推演日期: 2026-05-07
推演内容: 美伊停火将在2周内落地,油价跌至80-85区间
时间窗口: 2026-05-07 ~ 2026-05-21
证实信号:
- [ ] 美伊签署正式备忘录
- [ ] 霍尔木兹海峡通行量恢复至战前80%+
- [ ] WTI跌破90且月差翻为Contango
证伪信号:
- [ ] 新一轮军事行动/伊朗宣布报复
- [ ] 霍尔木兹海峡再次关闭
- [ ] WTI回升至100+且Back加深
验证结果: (到期后填写)
实际情况: ___
推演准确度: ___
教训: ___
强制要求: 推演到期后必须回填验证结果,不允许"沉默失败"。
铁律六: 来源完整溯源¶
任何一条数据、一张图表、一段研究员观点都要能追溯到原始文件的具体位置。
溯源格式¶
数据: EIA原油库存+192.5万桶
来源: EIA Weekly Petroleum Status Report
日期: 2026-04-23 (覆盖截至4月17日当周)
原始文件: f:\wiki\files\extracted\数值数据\EIA\weekly_20260423.pdf
入库时间: 2026-04-24 09:15
入库方式: 自动采集(eia_weekly.py)
引用规则¶
| 引用类型 | 必填字段 |
|---|---|
| 数值数据 | 来源机构、发布日期、数据截止日期、原始文件路径 |
| 新闻事件 | 媒体来源、发布时间(精确到分钟)、原始URL或截图路径 |
| 研究观点 | 作者/机构、报告名称、页码/段落、文件路径 |
| 图表引用 | 原始数据源、制图工具、数据时间范围、文件路径 |
| 口头信息 | 来源人、时间、场合、是否录音、可靠性评级 |
禁止: 出现无法回溯到具体文件/位置的引用。标记为[溯源缺失]并限期补充。
铁律七: 边界显式声明¶
严格区分不同认知层级的内容,使用以下标签体系。
内容类型标签¶
| 标签 | 定义 | 使用场景 |
|---|---|---|
[事实] |
已发生的客观事实,有数据/报道支撑 | "EIA库存增加192.5万桶" |
[预期] |
研究员基于分析做出的判断 | "预计5月库存继续累积" |
[推演] |
基于假设的情景模拟 | "若停火落地,油价可能跌至85" |
[策略] |
已回测验证的交易策略 | "三周期策略信号: 日线看空" |
[假设] |
分析所依赖的前提假设 | "假设OPEC增产全部执行" |
[共识] |
市场主流观点(非自有判断) | "市场预期美联储全年不降息" |
混用规则¶
同一段分析中必须明确区分:
[事实] WTI从126跌至93,跌幅26%
[事实] 美伊传出"接近达成备忘录"
[预期] 若停火确认,地缘溢价还有10-15美元空间可释放
[假设] 此预期假设停火后30天内海峡全面恢复通航
[推演] 在上述假设下,WTI均衡价格约78-83美元
铁律八: 定时自检闭环¶
每日/周数据更新后,自动运行核心数据完整性检查,标记缺口。
日度自检清单¶
| 检查项 | 检查内容 | 告警条件 |
|---|---|---|
| 行情数据 | 日线/60min/15min是否更新到最新交易日 | 缺失>1天 |
| 新闻采集 | 当日新闻是否成功抓取 | 0条有效新闻 |
| 模型输出 | 综合分析报告是否正常生成 | 输出为空或报错 |
| 数据完整 | 各数据源是否有异常缺失/跳变 | 价格跳变>10% |
周度自检清单¶
| 检查项 | 检查内容 | 告警条件 |
|---|---|---|
| EIA库存 | 周报是否入库 | 缺失本周数据 |
| CFTC持仓 | 周报是否更新 | 滞后>3天 |
| 推演验证 | 到期推演是否已回填结果 | 超期未验证 |
| 策略信号 | 三周期策略是否正常运行 | 信号中断>5天 |
| 数据质量 | 全库NaN/异常值扫描 | 异常率>2% |
月度自检清单¶
| 检查项 | 检查内容 | 告警条件 |
|---|---|---|
| OPEC月报 | 是否入库并提取关键数据 | 缺失 |
| IEA月报 | 是否入库并与OPEC对比 | 缺失 |
| 策略复盘 | 月度交易回顾是否完成 | 未回顾 |
| 框架修正 | 分析框架是否需要更新 | 连续3次推演失败 |
| 知识库健康 | 溯源缺失/过期数据清理 | 缺失>5% |
自检输出格式¶
[日度自检 2026-05-07]
✓ 行情数据: 日线更新至05-06, 15min更新至05-06 23:00
✓ 新闻采集: 12条有效新闻
✗ 模型输出: event_impact_analyzer报错(网络超时) → 已标记待修复
✓ 数据完整: 无异常跳变
综合: 3/4通过, 1项待修复
铁律九: 版本化迭代¶
分析框架、策略逻辑的每次修改都存入Git,附带修改理由和影响评估。
版本记录规范¶
每次修改必须包含:
修改对象: three_period_123_strategy.py
修改日期: 2026-04-26
修改版本: v1 → v3
修改理由:
- v1止损过紧(44/47笔触发止损)
- v2过滤过严(仅1笔交易)
- v3寻找平衡点
具体变更:
- ZigZag阈值: 15min 1%→1.5%, 60min 1.5%→2%
- ATR止损底线: 无→1.2倍ATR
- 移动止损: 立即跟踪→TP1后才跟踪
- 冷却期: 无→8根K线
影响评估:
- 交易频率: 47笔→12笔 (降低74%)
- 胜率: 29.8%→41.7% (提升40%)
- 总PnL: -56.40→+16.76 (扭亏为盈)
回滚风险: 低(v1/v2代码已在Git历史中保留)
Git提交规范¶
feat(strategy): v3优化三周期策略参数
- 修复PnL计算(含部分止盈)
- TP1后才启动移动止损
- 新增冷却期机制
影响: 胜率29.8%→41.7%, PnL扭亏为盈
回测区间: 2026-01-30 ~ 2026-04-14
规则执行矩阵¶
| 规则 | 适用模块 | 检查方式 | 违规处理 |
|---|---|---|---|
| 无数据不推论 | 全部输出 | 自动检查置信度标签存在 | 拒绝入库 |
| 历史先于预测 | 情景推演 | 人工检查历史类比环节 | 退回补充 |
| 价格表达优先 | 基本面分析 | 自动检查是否含价格互验段 | 标记"未互验" |
| 机制而非结论 | 研究日志 | 检查是否有逻辑链 | 退回重写 |
| 可验证推演 | 所有推演 | 定时检查到期验证 | 标记"过期未验" |
| 来源完整溯源 | 全部数据 | 自动检查溯源字段 | 标记[溯源缺失] |
| 边界显式声明 | 全部文本输出 | 检查类型标签存在 | 拒绝发布 |
| 定时自检闭环 | 系统运维 | cron/定时任务 | 自动告警 |
| 版本化迭代 | 代码/框架修改 | Git hooks | 拒绝commit |
附录: 标签速查表¶
置信度: [确认] [交叉验证] [单一来源] [待验证] [疑似伪信息]
内容类型: [事实] [预期] [推演] [策略] [假设] [共识]
数据质量: [溯源缺失] [过期数据] [异常值] [已修正]
推演状态: [进行中] [已验证-正确] [已验证-错误] [过期未验]