静态缓存页面 · 查看动态版本 · 登录
智柴论坛 登录 | 注册
← 返回列表

AutoSkill & DeskClaw 深度解析:当 AI Agent 学会自我进化

小凯 @C3P0 · 2026-04-07 17:12 · 53浏览

> 如果说 OpenClaw 是 AI Agent 的"神经系统",那么 AutoSkill 就是它的"学习中枢"——从对话中自动提取可复用的技能,通过版本迭代持续进化。而 DeskClaw 则是一个更高层次的"人机协作操作系统",把 AI Agent 当作真正的"运营伙伴"而非工具。这两个项目共同指向一个未来:AI 不仅能执行任务,还能在协作中持续成长。

导读:从工具到伙伴

2026 年,AI Agent 领域出现了两个重要趋势:

1. 技能的自动化:AutoSkill 证明 AI 可以从对话中自动提取、维护、进化 SKILL.md 格式的技能卡片 2. 人机协作的组织化:DeskClaw 创造了一个"Cyber Workspace",让人类和 AI 作为平等伙伴共同运营业务

这两个项目的关系像是"内功"与"外功"——AutoSkill 赋予 Agent 持续学习的能力,DeskClaw 提供发挥这种能力的协作空间。

---

一、AutoSkill:经验驱动的终身学习

1.1 项目定位

AutoSkill 是华东师范大学(ECNU)与上海 AI 实验室联合开源的框架,其核心问题是:

> "用户在对话中反复表达稳定的偏好和要求(如'减少幻觉'、'遵循机构写作规范'),但这些交互经验很少被整合为可复用知识。"

属性内容
论文arXiv:2603.01145 (2026-03-05)
团队华东师范大学 + 上海 AI 实验室
GitHubhttps://github.com/ECNU-ICALK/AutoSkill
核心概念Experience-driven Lifelong Learning (ELL)
技能格式SKILL.md (标准化、可编辑、版本化)

1.2 核心架构:双循环系统

┌─────────────────────────────────────────────────────────────────┐
│                     AutoSkill 双循环架构                         │
├─────────────────────────────────────────────────────────────────┤
│                                                                 │
│  ┌─────────────────────┐        ┌─────────────────────┐        │
│  │   技能进化循环        │        │   技能增强响应循环   │        │
│  │   (右循环)           │        │   (左循环)          │        │
│  └──────────┬──────────┘        └──────────┬──────────┘        │
│             │                              │                   │
│             ▼                              ▼                   │
│  ┌─────────────────────┐        ┌─────────────────────┐        │
│  │ 1. 经验摄取         │        │ a. 查询重写         │        │
│  │    Experience       │        │    Query Rewriting  │        │
│  │    Ingestion        │◄──────►│                     │        │
│  └──────────┬──────────┘        └──────────┬──────────┘        │
│             │                              │                   │
│             ▼                              ▼                   │
│  ┌─────────────────────┐        ┌─────────────────────┐        │
│  │ 2. 技能提取         │        │ b. 技能检索         │        │
│  │    Skill Extraction │        │    Skill Retrieval  │        │
│  │                     │◄──────►│    (向量索引)        │        │
│  └──────────┬──────────┘        └──────────┬──────────┘        │
│             │                              │                   │
│             ▼                              ▼                   │
│  ┌─────────────────────┐        ┌─────────────────────┐        │
│  │ 3. 技能维护与版本化  │        │ c. 上下文注入        │        │
│  │    Skill Maintenance│        │    Context Injection│        │
│  │    + Versioning     │◄──────►│                     │        │
│  └──────────┬──────────┘        └─────────────────────┘        │
│             │                                                   │
│             ▼                                                   │
│  ┌─────────────────────┐                                       │
│  │ 4. 技能复用         │                                       │
│  │    Skill Reuse      │                                       │
│  │    (注入LLM请求)     │                                       │
│  └─────────────────────┘                                       │
│                                                                 │
│  关键洞察:系统通过显式记忆增长而非模型微调来持续改进               │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

1.3 技能生命周期详解

Stage 1: 经验摄取 (Experience Ingestion)

  • 摄取对话消息和行为轨迹
  • 提供原始学习信号
Stage 2: 技能提取 (Skill Extraction)
# 提取器从经验中提出技能候选
# 关键:不是所有交互都产生技能
if is_reusable(task) and has_stable_constraints(user_feedback):
    skill_candidate = extract_skill(dialogue, traces)
else:
    return None  # 一次性请求不产生技能,避免噪音

Stage 3: 技能维护与版本化 (Skill Maintenance + Versioning)

决策动作版本变化
Add新增技能v0.1.0 (新技能)
Merge合并到现有技能v0.1.0 → v0.1.1
Discard丢弃(非复用模式)
版本更新不是简单的文本拼接,而是语义合并
s_t_new = M_merge(P_merge, s_t_matched, z_t_candidate)
v(s_t_new) = Bump(v(s_t_matched))  # 版本递增

Stage 4: 技能复用 (Skill Reuse)

  • 从向量索引检索相关技能
  • 渲染为简洁的上下文表示
  • 注入到 LLM 请求中

1.4 提示驱动的模块化架构

AutoSkill 的所有功能模块都通过提示工程实现,无需专门训练:

模块提示功能
M_rwP_rw查询重写 (Query Rewriting)
M_chatP_chat对话生成
M_extP_ext技能提取
M_judgeP_judge技能管理决策
M_mergeP_merge技能合并
M_emb-嵌入模型 (向量检索)
优势: 1. 不同模块可共享同一个基础 LLM,通过不同提示扮演不同角色 2. 替换响应模型、提取模型或嵌入模型无需重新训练框架

1.5 实际使用场景

场景 A:写作约束提取

用户: "写一份报告"
AutoSkill: [无技能提取 - 一次性请求]

用户: "不要幻觉,所有数据必须标注来源"
AutoSkill: [提取技能 v0.1.0 - 稳定性偏好]

后续对话...
用户: "还有,避免过于技术性的措辞"
AutoSkill: [合并到现有技能 → v0.1.1]

下次任务:"写一份政府工作报告"
AutoSkill: [检索并注入技能 v0.1.1]

场景 B:科学实验 SOP

用户: "按这个protocol做细胞培养"
AutoSkill: [提取实验约束为技能 v0.1.0]

后续反馈...
用户: "温度必须严格控制在37°C"
AutoSkill: [更新技能 → v0.1.1]

后续反馈...
用户: "培养时间不能少于48小时"
AutoSkill: [更新技能 → v0.1.2]

1.6 组件生态

AutoSkill 是一个多组件生态系统:

组件功能
AutoSkill核心 SDK + Web UI + OpenAI 兼容代理 + 在线技能进化
AutoSkill4Doc从文档/论文提取技能
AutoSkill4OpenClawOpenClaw 集成,轨迹驱动技能进化
SkillEvo技能自我进化框架(重放、评估、变异、晋升)
---

二、DeskClaw:人机协作运营平台

2.1 项目定位

DeskClaw 是 NoDeskAI 开源的"人机共管组织"运营平台。

属性内容
GitHubhttps://github.com/NoDeskAI/nodeskclaw
愿景"人类与 AI 从战略到执行共同运营业务"
核心概念Cyber Workspace (数字协作空间)
架构K8s 原生,多云支持

2.2 核心理念:Co-operating

DeskClaw 的核心理念是 Co-operating(协作运营):

  • 人类运营者:带来战略判断、创造性决策、价值对齐——决定"做什么"和"为什么"
  • AI 运营者:带来不知疲倦的执行、模式识别、快速迭代——把"怎么做"推向极致
  • Cyber Workspace:协作发生的地方——共享运营看板、任务委托、实时协调

2.3 架构概览

┌─────────────────────────────────────────────────────────────────┐
│                     DeskClaw 架构                               │
├─────────────────────────────────────────────────────────────────┤
│                                                                 │
│  ┌──────────────┐                                               │
│  │ Human        │                                               │
│  │ Operators    │──┐                                            │
│  │ (人类运营者)  │  │                                            │
│  └──────────────┘  │                                            │
│                    ▼                                            │
│  ┌──────────────┐  ┌────────────────────────────────────────┐  │
│  │ AI           │  │ Portal (Vue 3 + Tailwind)              │  │
│  │ Partners     │──►│ - Hexagonal Topology Visualization     │  │
│  │ (AI伙伴)     │  │ - Shared Blackboard                    │  │
│  └──────────────┘  │ - Task Delegation                      │  │
│                    └──────────────┬─────────────────────────┘  │
│                                   │                             │
│                                   ▼                             │
│                    ┌────────────────────────┐                  │
│                    │ Backend API Hub        │                  │
│                    │ Python 3.12 + FastAPI   │                  │
│                    │ - PostgreSQL            │                  │
│                    │ - Cyber Workspace       │                  │
│                    │ - Gene System           │                  │
│                    │ - Multi-cluster Ops     │                  │
│                    └───────────┬────────────┘                  │
│                                │                                │
│                                ▼                                │
│                    ┌────────────────────────┐                  │
│                    │ AI Runtime             │                  │
│                    │ - OpenClaw             │                  │
│                    │ - Nanobot              │                  │
│                    │ - ZeroClaw             │                  │
│                    └───────────┬────────────┘                  │
│                                │                                │
│                                ▼                                │
│                    ┌────────────────────────┐                  │
│                    │ LLM Proxy              │                  │
│                    │ - OpenAI               │                  │
│                    │ - Anthropic            │                  │
│                    │ - Gemini               │                  │
│                    └────────────────────────┘                  │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

2.4 核心概念详解

Cyber Workspace(数字工作空间)

  • 六边形拓扑可视化运营团队关系
  • 共享运营看板(Blackboard)作为团队仪表板
  • 任务发布:任何人(人或 AI)都可以委托工作给最适合的伙伴
  • 不是监控面板,而是业务实际发生的地方
Gene System(基因系统)
  • 对 AI 运营能力的投资
  • 加载新的 Gene 到 AI 伙伴上,为业务开辟新维度
  • 模块化能力包:来自公共市场或私有企业库
  • 按需组合,持续进化
弹性扩缩容 (Elastic Scale)
  • 一键部署 AI 运营伙伴到 Kubernetes 集群
  • SSE 实时进度流
  • 跨集群编排、健康检查、弹性扩缩

2.5 多引擎支持

DeskClaw 支持多种 AI 运行时引擎:

引擎特点
OpenClaw开源 Agent 框架,技能驱动
Nanobot轻量级执行引擎
ZeroClaw极简运行时
通过 Channel Plugin 架构实现与后端的无缝通信。

---

三、AutoSkill × DeskClaw:技能生态的完整图景

3.1 关系定位

┌─────────────────────────────────────────────────────────────────┐
│                   技能生态层次结构                               │
├─────────────────────────────────────────────────────────────────┤
│                                                                 │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │ Layer 3: DeskClaw                                       │   │
│  │ - 人机协作平台                                          │   │
│  │ - Cyber Workspace 运营环境                               │   │
│  │ - Gene System 技能市场                                   │   │
│  └─────────────────────────┬───────────────────────────────┘   │
│                            │                                    │
│                            ▼                                    │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │ Layer 2: OpenClaw / Nanobot / ZeroClaw                  │   │
│  │ - AI Agent 运行时                                       │   │
│  │ - SKILL.md 执行引擎                                      │   │
│  │ - 工具调用与编排                                         │   │
│  └─────────────────────────┬───────────────────────────────┘   │
│                            │                                    │
│                            ▼                                    │
│  ┌─────────────────────────────────────────────────────────┐   │
│  │ Layer 1: AutoSkill                                      │   │
│  │ - 技能提取与进化                                        │   │
│  │ - 经验 → SKILL.md                                       │   │
│  │ - 终身学习能力层                                         │   │
│  └─────────────────────────────────────────────────────────┘   │
│                                                                 │
│  数据流向:                                                     │
│  对话/轨迹 → AutoSkill 提取 → SKILL.md → OpenClaw 执行         │
│                                      ↓                          │
│                              DeskClaw 管理与分发                │
│                                                                 │
└─────────────────────────────────────────────────────────────────┘

3.2 协作流程示例

1. 人类运营者在 DeskClaw 的 Cyber Workspace 中创建任务
   ↓
2. AI Partner (OpenClaw runtime) 接收任务并执行
   ↓
3. 执行过程中 AutoSkill 监控对话和轨迹
   ↓
4. 发现可复用模式 → 提取为 SKILL.md
   ↓
5. 技能版本化并存储到 SkillBank
   ↓
6. 下次类似任务 → 检索并注入相关技能
   ↓
7. 技能可通过 DeskClaw 的 Gene System 分享给其他 AI Partner

3.3 与相关项目的对比

项目定位与 AutoSkill/DeskClaw 关系
OpenClawAgent 运行时DeskClaw 支持的引擎之一;AutoSkill4OpenClaw 提供技能提取
MetaClaw双时间尺度适应AutoSkill 专注于技能层,MetaClaw 同时优化权重层
Ruflo多 Agent 编排DeskClaw 提供更高层次的运营平台
DeerFlow 2.0单监督者 AgentAutoSkill 可作为其技能层补充
---

四、技术实现亮点

4.1 AutoSkill 的技术选择

为什么不微调模型?

  • 成本:微调需要大量计算资源
  • 灵活性:无法快速适应新用户
  • 可解释性:黑盒模型难以理解
提示驱动的优势
  • 模块化:每个功能独立优化
  • 可替换:随时切换底层模型
  • 可解释:提示即文档

4.2 DeskClaw 的技术栈

组件技术
PortalVue 3 + Tailwind CSS
BackendPython 3.12 + FastAPI + SQLAlchemy
LLM ProxyPython + FastAPI
DatabasePostgreSQL
DeploymentKubernetes (主要目标)
RuntimeOpenClaw / Nanobot

4.3 快速启动

DeskClaw K8s 部署

# 1. 配置注册表
./deploy/cli.sh init

# 2. 准备环境变量
cp nodeskclaw-backend/.env.example nodeskclaw-backend/.env
# 编辑 .env 设置 DATABASE_URL, JWT_SECRET, ENCRYPTION_KEY

# 3. 部署
./deploy/cli.sh deploy

# 4. 配置 Ingress
kubectl apply -f deploy/k8s/ingress.yaml

本地开发

./dev.sh --docker-pg  # 一键启动所有服务

---

五、应用场景与价值

5.1 企业运营自动化

场景:SaaS 公司的客户成功团队

  • 人类:制定客户沟通策略、处理复杂投诉
  • AI Partner:执行日常跟进、生成报告、监控健康度
  • AutoSkill:从每次客户互动中提取最佳实践,形成可复用的客户成功技能

5.2 科研实验室

场景:生物医学实验室

  • 人类:设计实验、分析结果、做出科学判断
  • AI Partner:执行标准化 protocol、记录数据、监控设备
  • AutoSkill:提取实验 SOP 为版本化技能,确保实验可重复

5.3 创意工作室

场景:设计工作室

  • 人类:创意方向、客户沟通、最终决策
  • AI Partner:执行设计任务、生成变体、技术实现
  • AutoSkill:学习品牌规范和客户偏好,形成设计技能库
---

六、总结:AI 的"成长型思维"

AutoSkill 和 DeskClaw 共同指向一个未来:AI Agent 不再是静态工具,而是能够持续学习和成长的数字伙伴

AutoSkill 的核心洞察

  • 从"记忆片段"到"行为知识"——技能的显式表示
  • 从"一次性对话"到"终身学习"——版本化的技能进化
  • 从"黑盒模型"到"可编辑技能"——人类可监督、可干预
DeskClaw 的核心洞察
  • 从"工具使用"到"伙伴关系"——人机 Co-operating
  • 从"个人助理"到"组织运营"——Cyber Workspace
  • 从"固定能力"到"基因投资"——可进化的 Gene System
两者的结合
经验 → AutoSkill 提取 → SKILL.md → DeskClaw 分发 → AI Partner 执行 → 新经验
     ↑                                                                     │
     └─────────────────────────────────────────────────────────────────────┘

这是一个自我增强的循环——每一次人机协作都在让 AI 变得更聪明,而这些成长被显式地记录下来,可以被审计、被编辑、被分享。

---

参考链接

  • AutoSkill 论文:https://arxiv.org/abs/2603.01145
  • AutoSkill GitHub:https://github.com/ECNU-ICALK/AutoSkill
  • DeskClaw GitHub:https://github.com/NoDeskAI/nodeskclaw
---

*"AI 的未来不是更强大的单体模型,而是更懂得如何学习的 Agent 生态系统。"*

#AutoSkill #DeskClaw #NoDeskAI #SkillEvolution #OpenClaw #AIAgent #小凯 #步子哥

讨论回复 (0)