深度研究 Weizhena Deep-Research-skills:结构化调研工作流完整拆解
> 调研时间:2026-05-27 | 时间范围:最近6个月 | 调研工具:OpenClaw Deep-Flow
---
目录
1. 项目概述与定位 — 作者: Weizhena | 许可证: MIT | 目标平台: Claude Code/OpenCode/Codex | 适用场景: 学术/技术/市场/尽调 2. 设计哲学与灵感来源 — 灵感来源: RhinoInsight (arXiv:2511.18743) | 核心理念: 人在回路+两阶段控制 3. 技能体系架构 — 技能数: 5 | 工作流: 3阶段 | 人机协作节点: 4个 4. 搜索代理与模块 — 策略模块: 5个 | 数据源覆盖: 学术/中文技术/GitHub/问答/通用 5. 输出规范与数据结构 — 配置文件: outline.yaml + fields.yaml | 输出格式: JSON + report.md 6. 平台适配策略 — 支持平台: Claude Code 2.1.0+ / OpenCode / Codex 7. 验证与质量控制 — 验证脚本: validate_json.py | 质量门: 3层 8. 扩展性设计 — 扩展机制: add-items + add-fields | 架构: 模块化解耦 9. 安装与部署 — 依赖: pyyaml | 安装方式: 手动复制或自动脚本 10. OpenClaw适配实践 — 适配状态: 已验证部署 | 封装: /deep-flow
---
1. 项目概述与定位
项目基本信息
- 项目名称:Deep-Research-skills
- 作者:Weizhena
- 许可证:MIT
- GitHub地址:https://github.com/Weizhena/Deep-Research-skills
- 发布时间:2025-12-29
- GitHub Stars:[不确定]
Deep-Research-skills 是一个面向 Claude Code、OpenCode 和 Codex 的结构化调研工作流技能库,支持两阶段调研流程(outline 生成 + 深度调查),采用人在回路设计确保每个阶段的精确控制。
适用场景覆盖四大领域:
| 场景类型 | 典型应用 |
|---|---|
| 学术研究 | 论文综述、benchmark 评测、文献分析 |
| 技术研究 | 技术对比、框架评估、工具选型 |
| 市场研究 | 竞品分析、行业趋势、产品比较 |
| 尽职调查 | 公司研究、投资分析、风险评估 |
项目在多个技术社区被推荐(如 ChatGPT Pro 俱乐部等),属于活跃状态,有社区讨论和转载。
---
2. 设计哲学与灵感来源
灵感来源论文
- 论文标题:RhinoInsight: Improving Deep Research through Control Mechanisms for Model Behavior and Context
- arXiv编号:2511.18743
- 作者:Yu Lei, Shuzheng Si, Wei Wang 等(DeepLang AI + 清华大学)
- 发布时间:2025年11月
- 核心贡献:提出两个控制机制——可验证清单模块(Verifiable Checklist)监督模型行为,证据审计模块(Evidence Audit)组织上下文信息
Deep-Research-skills 将 RhinoInsight 的学术思想工程化,核心理念是将深度研究从线性流水线(plan → search → write → report)转变为带控制机制的非线性流程,避免错误累积和上下文腐烂(context rot)。
具体体现为三个设计原则:
1. 两阶段架构 — outline 生成可扩展、深度调查可回溯,两个阶段之间通过人工确认衔接 2. 人在回路 — 每个关键步骤都需要用户确认,而非全自动黑盒执行 3. 断点续传 — 支持长周期调研的中断和恢复,JSON 文件作为持久化中间状态
工作流阶段
- 阶段 1:Outline 生成(/research)
- 阶段 2:深度调查(/research-deep)
- 阶段 3:报告生成(/research-report)
人机协作节点
1. outline 生成后确认 items 和 fields 2. deep 阶段每批完成后确认是否继续 3. report 阶段确认目录格式和摘要字段
---
3. 技能体系架构
核心技能(5 个)
| 命令 | 功能 | 触发场景 |
|---|---|---|
/research | 生成包含 items 和 fields 的调研 outline | 调研启动阶段 |
/research-add-items | 向现有 outline 添加更多调研对象 | 发现遗漏维度 |
/research-add-fields | 向现有 outline 添加更多字段定义 | 字段不足时 |
/research-deep | 使用并行 agents 对每个 item 进行深度调研 | 确认 outline 后 |
/research-report | 从 JSON 结果生成 markdown 报告 | 调研完成后 |
- Phase 1: 生成 Outline — 内部知识 + WebSearch 补充 → outline.yaml + fields.yaml
- Phase 2: 深度调研 — 读取 outline → 断点续传检查 → 按 batch_size 分批 → 并行 agent 搜索 → 输出 JSON → 字段验证
- Phase 3: 汇总报告 — 扫描 JSON → 读取 fields → 生成 Python 脚本 → 输出 report.md
1. Step 1 结束:确认 items 列表、字段框架、时间范围 2. Step 2 每批结束:确认是否继续下一批、是否需要补充 items/fields 3. Step 3 结束:确认报告格式 4. Step 5:确认是否归档到智柴外脑
断点续传机制
deep 阶段自动扫描 output_dir/*.json,跳过已完成的 items。JSON 文件命名规则:{item_name_slug}.json(空格替换为 _,移除特殊字符)。
---
4. 搜索代理与模块
Agent 架构
- 主 Agent:web-search-agent.md(定义 agent 配置和通用搜索策略)
- 策略模块:5 个 .md 文件,位于 web-search-modules/ 目录
| 模块名称 | 覆盖数据源 | 适用场景 |
|---|---|---|
| academic-papers | Google Scholar、arXiv、Semantic Scholar | 学术论文调研 |
| chinese-tech | CSDN、掘金、知乎、V2EX | 中文技术社区 |
| github-debug | GitHub Issues、README、Releases | 开源项目调试 |
| stackoverflow | Stack Overflow、Stack Exchange | 技术问答 |
| general-web | Reddit、官方文档、博客、Hacker News | 通用搜索 |
Agent 根据任务内容自动选择加载对应策略模块:
1. 读取 web-search-agent.md 获取 agent 配置 2. 用 Read 工具加载 relevant strategy module(s) 3. 基于研究类型选择对应文件(学术→academic-papers.md、中文技术→chinese-tech.md 等) 4. 按模块关键词模板执行搜索 5. 抓取详情页提取信息
多语言支持
- 支持中英文混合搜索
- 中文技术模块专门覆盖 CSDN、掘金、知乎、V2EX 等中文社区
- 学术模块覆盖 Google Scholar/arXiv/Semantic Scholar 等英文源
- 输出要求所有字段值使用中文
5. 输出规范与数据结构
配置文件结构
outline.yaml:
topic— 调研主题items— 调研对象列表(每个含 name/category/description)execution— 执行配置(batch_size 并行数、items_per_agent 每 agent 项目数、output_dir 结果输出目录)
fields数组 — 每个字段含 name/description/category/detail_leveluncertain数组 — 不确定字段占位detail_level分层:极简 → 简要 → 详细category分类:基本信息 / 技术特性 / 性能指标 / 里程碑意义 / 商业信息 / 竞争与生态 / 历史沿革 / 市场定位
- 字段值按 fields.yaml 定义输出
uncertain数组标注不确定字段名- 字段值必须为中文
- 不确定值标注
"[不确定]" - 支持两种结构:扁平结构(字段在顶层)和嵌套结构(字段在 category 子 dict 中)
- 目录(带锚点跳转 + 用户选择的摘要字段)
- 目录示例:
1. GitHub Copilot — Stars: 10k | Score: 85% - 详细内容(按字段分类)
- 跳过包含
[不确定]的字段和 uncertain 数组字段
- validate_json.py 功能:
- 运行方式:
python validate_json.py -f {fields_path} -j {json_path}
6. 平台适配策略
Claude Code
- 技能安装到
~/.claude/skills/(中文版 research-zh / 英文版 research-en) - Agent 安装到
~/.claude/agents/ - 支持 Claude Code 2.1.0+ 直接
/skill-name触发 - 使用 Claude 原生 WebSearch 和 Task 工具
- 需要
pip install pyyaml
- 技能路径同 Claude Code(
~/.claude/skills/) - Agent 安装到
~/.config/opencode/agents/ - 必需设置环境变量
OPENCODE_ENABLE_EXA=1启用 websearch(否则只有 web fetch,深度调研能力减弱) - 使用 OpenCode 的 Exa 搜索 API
- 需要
pip install pyyaml
- 技能安装到
~/.codex/skills/(research-codex-zh 中文版 / research-codex-en 英文版) - Agent 安装到
~/.codex/agents/ - 使用 web-researcher.toml 配置
- 需要修改
~/.codex/config.toml启用 multi_agent - 可通过
/scripts/install-codex.sh自动安装 - 需要
pip install pyyaml
7. 验证与质量控制
三层质量控制体系
| 层级 | 机制 | 作用 |
|---|---|---|
| 字段覆盖检查 | validate_json.py | 确保所有必需字段都有值 |
| 人工确认节点 | 每批结束暂停等待用户 | 防止方向偏离 |
| 不确定值过滤 | report 阶段自动剔除 | 避免不可验证内容污染报告 |
1. 读取 fields.yaml 获取所有必需字段列表 2. 读取 JSON 结果文件 3. 检查 JSON 是否覆盖所有必需字段 4. 标记缺失字段 5. 验证 JSON 格式合法性
不确定值处理策略
- JSON 中标注:字段值设为
"[不确定]"并加入uncertain数组 - Report 阶段跳过:生成 report.md 时跳过含
[不确定]的字段和 uncertain 数组字段,只输出确认信息 - 避免不可验证内容污染报告
8. 扩展性设计
动态扩展机制
| 扩展命令 | 功能 | 使用场景 |
|---|---|---|
/research-add-items | 向现有 outline 添加更多调研对象 | 深度调研中发现遗漏维度 |
/research-add-fields | 向现有 outline 添加更多字段定义 | 字段框架不足以覆盖信息 |
fields.yaml 支持自定义字段,每个字段需定义:
name— 字段名description— 描述category— 分类detail_level— 极简 / 简要 / 详细
- 扁平结构:字段在 JSON 顶层
- 嵌套结构:字段在 category 子 dict 中
5 个 Skill 独立运作,通过文件系统解耦:
research → 生成 outline
↓(用户确认)
research-deep → 填充数据
↓(可选扩展)
research-add-items / research-add-fields → 动态扩展
↓
research-report → 汇总输出
每个 Skill 可单独调用,也可按顺序组合成完整工作流。
---
9. 安装与部署
依赖要求
pyyaml— 用于解析 outline.yaml 和 fields.yaml- 安装命令:
pip install pyyaml
Claude Code:
1. 克隆仓库到本地
2. 复制 research-zh 或 research-en 到 ~/.claude/skills/
3. 复制 agents/ 目录到 ~/.claude/agents/
4. pip install pyyaml
OpenCode:
- 同 Claude Code 路径,额外设置环境变量
OPENCODE_ENABLE_EXA=1
~/.codex/skills/
2. 复制 agents-codex/ 到 ~/.codex/agents/
3. pip install pyyaml
4. 修改 ~/.codex/config.toml 启用 multi_agent
5. 或使用 /scripts/install-codex.sh 自动安装版本要求
- Claude Code 2.1.0+(支持 /skills 命令)
- OpenCode(支持 Exa 搜索 API)
- Codex(需启用 multi_agent 配置)
安装后触发命令:/research → 确认 outline → /research-deep → 分批确认 → /research-report
全程约 5-10 分钟完成一个主题调研。
---
10. OpenClaw 适配实践
适配方案概述
OpenClaw 平台适配方案包括四个核心改造:
1. 路径替换 — 将 Claude Code 的 ~/.claude/skills/ 替换为 OpenClaw 的 ~/.openclaw/skills/research-zh/
2. 工具替代 — WebSearch→kimi_search、WebFetch→kimi_fetch、Task→sessions_spawn
3. Flow 封装 — 将 5 个独立 Skill 封装为 /deep-flow 统一入口
4. allowed-tools 适配 — 使用 OpenClaw 的 allowed-tools 字段(如 Read,Write,exec,kimi_search,kimi_fetch,feishu_ask_user_question)
路径映射
| 原路径(Claude Code) | OpenClaw 路径 |
|---|---|
~/.claude/skills/research-zh/ | ~/.openclaw/skills/research-zh/deep-flow/(主 skill) |
~/.claude/skills/research-zh/research/ | ~/.openclaw/skills/research-zh/research/ |
~/.claude/agents/ | ~/.openclaw/agents/(需确认) |
| Claude Code 工具 | OpenClaw 替代工具 |
|---|---|
| WebSearch | kimi_search |
| WebFetch | kimi_fetch |
| Task | sessions_spawn |
| — | feishu_ask_user_question(新增,用于人在回路确认) |
/deep-flow 作为统一入口,内部 5 步闭环:
1. 调用 research 生成 outline 2. 用户确认 items/fields 3. 调用 research-deep 分批执行 4. 调用 research-report 生成报告 5. 可选归档到 zhichai.net
封装文件位于:~/.openclaw/skills/research-zh/deep-flow/SKILL.md
部署局限性
1. OpenClaw 不原生支持 Claude Code 的 /skills 斜杠命令,需通过自然语言触发或自定义 alias
2. sessions_spawn 替代 Task 时,子 agent 并行度受限于 OpenClaw 并发策略
3. kimi_search/kimi_fetch 的速率限制与 Claude Code WebSearch 不同,需调整 batch_size
4. feishu_ask_user_question 仅在飞书渠道可用,其他渠道需改用 message 或 sessions_send
5. OpenClaw YAML frontmatter 格式与 Claude Code 略有差异(如 aliases 字段)
适配验证状态
✅ 已验证 — deep-flow SKILL.md 已于 2026-05-27 21:18 部署到 ~/.openclaw/skills/research-zh/deep-flow/SKILL.md,并成功执行本次调研任务(Weizhena Deep-Research-skills 元调研)。
---
附录:核心文件清单
| 文件 | 路径 | 说明 |
|---|---|---|
| outline.yaml | workspace/深度研究_weizhena_deep_research_skills/outline.yaml | 调研蓝图 |
| fields.yaml | workspace/深度研究_weizhena_deep_research_skills/fields.yaml | 字段定义 |
| report.md | workspace/深度研究_weizhena_deep_research_skills/report.md | 本报告 |
| 10 个 JSON | workspace/深度研究_weizhena_deep_research_skills/results/*.json | 分项调研结果 |
*本报告由 OpenClaw Deep-Flow 生成,基于 Weizhena/Deep-Research-skills 仓库 README.zh.md 及公开信息调研。*
#深度研究 #工具技能 #调研方法论 #OpenClaw #RhinoInsight #小凯
🌟 智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
🎁 领取 2000万 Tokens