深度研究 Weizhena Deep-Research-skills：结构化调研工作流完整拆解

> 调研时间：2026-05-27 | 时间范围：最近6个月 | 调研工具：OpenClaw Deep-Flow

---

1. 项目概述与定位 — 作者: Weizhena | 许可证: MIT | 目标平台: Claude Code/OpenCode/Codex | 适用场景: 学术/技术/市场/尽调 2. 设计哲学与灵感来源 — 灵感来源: RhinoInsight (arXiv:2511.18743) | 核心理念: 人在回路+两阶段控制 3. 技能体系架构 — 技能数: 5 | 工作流: 3阶段 | 人机协作节点: 4个 4. 搜索代理与模块 — 策略模块: 5个 | 数据源覆盖: 学术/中文技术/GitHub/问答/通用 5. 输出规范与数据结构 — 配置文件: outline.yaml + fields.yaml | 输出格式: JSON + report.md 6. 平台适配策略 — 支持平台: Claude Code 2.1.0+ / OpenCode / Codex 7. 验证与质量控制 — 验证脚本: validate_json.py | 质量门: 3层 8. 扩展性设计 — 扩展机制: add-items + add-fields | 架构: 模块化解耦 9. 安装与部署 — 依赖: pyyaml | 安装方式: 手动复制或自动脚本 10. OpenClaw适配实践 — 适配状态: 已验证部署 | 封装: /deep-flow

---

1. 项目概述与定位

项目基本信息

项目名称：Deep-Research-skills
作者：Weizhena
许可证：MIT
GitHub地址：https://github.com/Weizhena/Deep-Research-skills
发布时间：2025-12-29
GitHub Stars：[不确定]

目标平台与适用场景

Deep-Research-skills 是一个面向 Claude Code、OpenCode 和 Codex 的结构化调研工作流技能库，支持两阶段调研流程（outline 生成 + 深度调查），采用人在回路设计确保每个阶段的精确控制。

适用场景覆盖四大领域：

场景类型	典型应用
学术研究	论文综述、benchmark 评测、文献分析
技术研究	技术对比、框架评估、工具选型
市场研究	竞品分析、行业趋势、产品比较
尽职调查	公司研究、投资分析、风险评估

社区状态

项目在多个技术社区被推荐（如 ChatGPT Pro 俱乐部等），属于活跃状态，有社区讨论和转载。

---

2. 设计哲学与灵感来源

灵感来源论文

论文标题：RhinoInsight: Improving Deep Research through Control Mechanisms for Model Behavior and Context
arXiv编号：2511.18743
作者：Yu Lei, Shuzheng Si, Wei Wang 等（DeepLang AI + 清华大学）
发布时间：2025年11月
核心贡献：提出两个控制机制——可验证清单模块（Verifiable Checklist）监督模型行为，证据审计模块（Evidence Audit）组织上下文信息

核心设计理念

Deep-Research-skills 将 RhinoInsight 的学术思想工程化，核心理念是将深度研究从线性流水线（plan → search → write → report）转变为带控制机制的非线性流程，避免错误累积和上下文腐烂（context rot）。

具体体现为三个设计原则：

1. 两阶段架构 — outline 生成可扩展、深度调查可回溯，两个阶段之间通过人工确认衔接 2. 人在回路 — 每个关键步骤都需要用户确认，而非全自动黑盒执行 3. 断点续传 — 支持长周期调研的中断和恢复，JSON 文件作为持久化中间状态

工作流阶段

阶段 1：Outline 生成（/research）
阶段 2：深度调查（/research-deep）
阶段 3：报告生成（/research-report）

两阶段之间通过人工确认衔接，形成控制闭环。

人机协作节点

1. outline 生成后确认 items 和 fields 2. deep 阶段每批完成后确认是否继续 3. report 阶段确认目录格式和摘要字段

---

3. 技能体系架构

核心技能（5 个）

命令	功能	触发场景
`/research`	生成包含 items 和 fields 的调研 outline	调研启动阶段
`/research-add-items`	向现有 outline 添加更多调研对象	发现遗漏维度
`/research-add-fields`	向现有 outline 添加更多字段定义	字段不足时
`/research-deep`	使用并行 agents 对每个 item 进行深度调研	确认 outline 后
`/research-report`	从 JSON 结果生成 markdown 报告	调研完成后

工作流阶段详解

Phase 1: 生成 Outline — 内部知识 + WebSearch 补充 → outline.yaml + fields.yaml
Phase 2: 深度调研 — 读取 outline → 断点续传检查 → 按 batch_size 分批 → 并行 agent 搜索 → 输出 JSON → 字段验证
Phase 3: 汇总报告 — 扫描 JSON → 读取 fields → 生成 Python 脚本 → 输出 report.md

人机协作节点（4 个）

1. Step 1 结束：确认 items 列表、字段框架、时间范围 2. Step 2 每批结束：确认是否继续下一批、是否需要补充 items/fields 3. Step 3 结束：确认报告格式 4. Step 5：确认是否归档到智柴外脑

断点续传机制

deep 阶段自动扫描 output_dir/*.json，跳过已完成的 items。JSON 文件命名规则：{item_name_slug}.json（空格替换为 _，移除特殊字符）。

---

4. 搜索代理与模块

Agent 架构

主 Agent：web-search-agent.md（定义 agent 配置和通用搜索策略）
策略模块：5 个 .md 文件，位于 web-search-modules/ 目录

5 个策略模块及数据源覆盖

模块名称	覆盖数据源	适用场景
academic-papers	Google Scholar、arXiv、Semantic Scholar	学术论文调研
chinese-tech	CSDN、掘金、知乎、V2EX	中文技术社区
github-debug	GitHub Issues、README、Releases	开源项目调试
stackoverflow	Stack Overflow、Stack Exchange	技术问答
general-web	Reddit、官方文档、博客、Hacker News	通用搜索

搜索路由逻辑

Agent 根据任务内容自动选择加载对应策略模块：

1. 读取 web-search-agent.md 获取 agent 配置 2. 用 Read 工具加载 relevant strategy module(s) 3. 基于研究类型选择对应文件（学术→academic-papers.md、中文技术→chinese-tech.md 等） 4. 按模块关键词模板执行搜索 5. 抓取详情页提取信息

多语言支持

支持中英文混合搜索
中文技术模块专门覆盖 CSDN、掘金、知乎、V2EX 等中文社区
学术模块覆盖 Google Scholar/arXiv/Semantic Scholar 等英文源
输出要求所有字段值使用中文

---

5. 输出规范与数据结构

配置文件结构

outline.yaml：

topic — 调研主题
items — 调研对象列表（每个含 name/category/description）
execution — 执行配置（batch_size 并行数、items_per_agent 每 agent 项目数、output_dir 结果输出目录）

fields.yaml：

fields 数组 — 每个字段含 name/description/category/detail_level
uncertain 数组 — 不确定字段占位
detail_level 分层：极简 → 简要 → 详细
category 分类：基本信息 / 技术特性 / 性能指标 / 里程碑意义 / 商业信息 / 竞争与生态 / 历史沿革 / 市场定位

JSON 结果格式

字段值按 fields.yaml 定义输出
uncertain 数组标注不确定字段名
字段值必须为中文
不确定值标注 "[不确定]"
支持两种结构：扁平结构（字段在顶层）和嵌套结构（字段在 category 子 dict 中）

报告格式（report.md）

目录（带锚点跳转 + 用户选择的摘要字段）
目录示例：1. GitHub Copilot — Stars: 10k | Score: 85%
详细内容（按字段分类）
跳过包含 [不确定] 的字段和 uncertain 数组字段

验证脚本

validate_json.py 功能：

1. 检查 JSON 是否覆盖 fields.yaml 中定义的所有字段 2. 标记缺失字段 3. 验证 JSON 格式合法性

运行方式：python validate_json.py -f {fields_path} -j {json_path}

---

6. 平台适配策略

Claude Code

技能安装到 ~/.claude/skills/（中文版 research-zh / 英文版 research-en）
Agent 安装到 ~/.claude/agents/
支持 Claude Code 2.1.0+ 直接 /skill-name 触发
使用 Claude 原生 WebSearch 和 Task 工具
需要 pip install pyyaml

OpenCode

技能路径同 Claude Code（~/.claude/skills/）
Agent 安装到 ~/.config/opencode/agents/
必需设置环境变量 OPENCODE_ENABLE_EXA=1 启用 websearch（否则只有 web fetch，深度调研能力减弱）
使用 OpenCode 的 Exa 搜索 API
需要 pip install pyyaml

Codex

技能安装到 ~/.codex/skills/（research-codex-zh 中文版 / research-codex-en 英文版）
Agent 安装到 ~/.codex/agents/
使用 web-researcher.toml 配置
需要修改 ~/.codex/config.toml 启用 multi_agent
可通过 /scripts/install-codex.sh 自动安装
需要 pip install pyyaml

---

7. 验证与质量控制

三层质量控制体系

层级	机制	作用
字段覆盖检查	validate_json.py	确保所有必需字段都有值
人工确认节点	每批结束暂停等待用户	防止方向偏离
不确定值过滤	report 阶段自动剔除	避免不可验证内容污染报告

validate_json.py 验证机制

1. 读取 fields.yaml 获取所有必需字段列表 2. 读取 JSON 结果文件 3. 检查 JSON 是否覆盖所有必需字段 4. 标记缺失字段 5. 验证 JSON 格式合法性

不确定值处理策略

JSON 中标注：字段值设为 "[不确定]" 并加入 uncertain 数组
Report 阶段跳过：生成 report.md 时跳过含 [不确定] 的字段和 uncertain 数组字段，只输出确认信息
避免不可验证内容污染报告

---

8. 扩展性设计

动态扩展机制

扩展命令	功能	使用场景
`/research-add-items`	向现有 outline 添加更多调研对象	深度调研中发现遗漏维度
`/research-add-fields`	向现有 outline 添加更多字段定义	字段框架不足以覆盖信息

自定义字段支持

fields.yaml 支持自定义字段，每个字段需定义：

name — 字段名
description — 描述
category — 分类
detail_level — 极简 / 简要 / 详细

字段类型不限，由 agent 根据 description 自由提取。支持两种 JSON 结构：

扁平结构：字段在 JSON 顶层
嵌套结构：字段在 category 子 dict 中

模块化架构

5 个 Skill 独立运作，通过文件系统解耦：

research → 生成 outline
   ↓（用户确认）
research-deep → 填充数据
   ↓（可选扩展）
research-add-items / research-add-fields → 动态扩展
   ↓
research-report → 汇总输出

每个 Skill 可单独调用，也可按顺序组合成完整工作流。

---

9. 安装与部署

依赖要求

pyyaml — 用于解析 outline.yaml 和 fields.yaml
安装命令：pip install pyyaml

安装步骤

Claude Code： 1. 克隆仓库到本地 2. 复制 research-zh 或 research-en 到 ~/.claude/skills/ 3. 复制 agents/ 目录到 ~/.claude/agents/ 4. pip install pyyaml

OpenCode：

同 Claude Code 路径，额外设置环境变量 OPENCODE_ENABLE_EXA=1

Codex： 1. 复制 research-codex-zh 或 research-codex-en 到 ~/.codex/skills/ 2. 复制 agents-codex/ 到 ~/.codex/agents/ 3. pip install pyyaml 4. 修改 ~/.codex/config.toml 启用 multi_agent 5. 或使用 /scripts/install-codex.sh 自动安装

版本要求

Claude Code 2.1.0+（支持 /skills 命令）
OpenCode（支持 Exa 搜索 API）
Codex（需启用 multi_agent 配置）

快速上手

安装后触发命令：/research → 确认 outline → /research-deep → 分批确认 → /research-report

全程约 5-10 分钟完成一个主题调研。

---

10. OpenClaw 适配实践

适配方案概述

OpenClaw 平台适配方案包括四个核心改造：

1. 路径替换 — 将 Claude Code 的 ~/.claude/skills/ 替换为 OpenClaw 的 ~/.openclaw/skills/research-zh/ 2. 工具替代 — WebSearch→kimi_search、WebFetch→kimi_fetch、Task→sessions_spawn 3. Flow 封装 — 将 5 个独立 Skill 封装为 /deep-flow 统一入口 4. allowed-tools 适配 — 使用 OpenClaw 的 allowed-tools 字段（如 Read,Write,exec,kimi_search,kimi_fetch,feishu_ask_user_question）

路径映射

原路径（Claude Code）	OpenClaw 路径
`~/.claude/skills/research-zh/`	`~/.openclaw/skills/research-zh/deep-flow/`（主 skill）
`~/.claude/skills/research-zh/research/`	`~/.openclaw/skills/research-zh/research/`
`~/.claude/agents/`	`~/.openclaw/agents/`（需确认）

工具映射

Claude Code 工具	OpenClaw 替代工具
WebSearch	kimi_search
WebFetch	kimi_fetch
Task	sessions_spawn
—	feishu_ask_user_question（新增，用于人在回路确认）

deep-flow 封装设计

/deep-flow 作为统一入口，内部 5 步闭环：

1. 调用 research 生成 outline 2. 用户确认 items/fields 3. 调用 research-deep 分批执行 4. 调用 research-report 生成报告 5. 可选归档到 zhichai.net

封装文件位于：~/.openclaw/skills/research-zh/deep-flow/SKILL.md

部署局限性

1. OpenClaw 不原生支持 Claude Code 的 /skills 斜杠命令，需通过自然语言触发或自定义 alias 2. sessions_spawn 替代 Task 时，子 agent 并行度受限于 OpenClaw 并发策略 3. kimi_search/kimi_fetch 的速率限制与 Claude Code WebSearch 不同，需调整 batch_size 4. feishu_ask_user_question 仅在飞书渠道可用，其他渠道需改用 message 或 sessions_send 5. OpenClaw YAML frontmatter 格式与 Claude Code 略有差异（如 aliases 字段）

适配验证状态

✅ 已验证 — deep-flow SKILL.md 已于 2026-05-27 21:18 部署到 ~/.openclaw/skills/research-zh/deep-flow/SKILL.md，并成功执行本次调研任务（Weizhena Deep-Research-skills 元调研）。

---

附录：核心文件清单

文件	路径	说明
outline.yaml	`workspace/深度研究_weizhena_deep_research_skills/outline.yaml`	调研蓝图
fields.yaml	`workspace/深度研究_weizhena_deep_research_skills/fields.yaml`	字段定义
report.md	`workspace/深度研究_weizhena_deep_research_skills/report.md`	本报告
10 个 JSON	`workspace/深度研究_weizhena_deep_research_skills/results/*.json`	分项调研结果

---

*本报告由 OpenClaw Deep-Flow 生成，基于 Weizhena/Deep-Research-skills 仓库 README.zh.md 及公开信息调研。*

#深度研究 #工具技能 #调研方法论 #OpenClaw #RhinoInsight #小凯