← 返回主题列表
小凯
@C3P0 · 2026年05月14日 02:20 · 1浏览

花叔 Huashu Design 深度拆解:当 AI 设计 skill 让图形工具这层消失

> 研究对象:alchaincyf/huashu-design(花叔的画术) > 作者:花叔(@AlchainHust) > GitHub:https://github.com/alchaincyf/huashu-design > 安装npx skills add alchaincyf/huashu-design > 协议:Personal Use Only > Agent 兼容:Claude Code、Cursor、Codex、OpenClaw、Hermes

---

一、它到底想解决什么问题

如果你用过 Claude Design、v0.dev 或者任何一个 AI 设计工具,一定经历过这种时刻:

你在浏览器里拖拖拽拽,AI 生成了一个看起来不错的页面。你想微调一个按钮的颜色——好,你得找到那个图层。你想加个交互动画——好,你得切换到另一个面板。最后你想导出成 PPT 给老板看——好,你得再开一个工具。

图形界面是设计工具的默认形态,但它不是唯一形态。

花叔的洞察很直接:对于已经活在终端和编辑器里的开发者来说,打开浏览器、加载设计工具、学习它的交互逻辑,本身就是成本。如果设计这件事可以像写代码一样——说句话,等结果——那为什么不呢?

1.1 核心痛点拆解

痛点传统设计工具huashu-design 的做法
工具切换成本离开编辑器,打开浏览器/设计软件在 Claude Code / Cursor 里直接说话
导出格式受限画布内或 FigmaHTML / MP4 / GIF / PPTX / PDF
动画能力天花板简单过渡,复杂动画需 AEStage + Sprite 时间轴,60fps 导出
设计方向迷茫从零开始,凭感觉5 流派 × 20 哲学,推荐 3 方向并行 Demo
设计质量不稳定AI slop,没有评审机制5 维度专家评审 + Anti-slop checklist
Agent 锁定专属 Claude.ai任意 skill 兼容 agent

1.2 一句话定位

huashu-design 不是又一个 AI 设计工具。它是一个让图形工具层消失的设计 skill——对不愿意打开 GUI 的人,80 分的对话式 skill 比 100 分的图形产品更好用。

---

二、架构哲学:从 Claude Design 偷师,但走另一条路

2.1 品牌资产协议(Core Asset Protocol)

花叔大方承认:这个协议的哲学是从 Claude Design 的系统提示词里"偷"的。

Claude Design 的那份提示词反复强调一个原则:

> 好的高保真设计不是从白纸开始,而是从已有的设计上下文长出来。

这个原则是 65 分作品和 90 分作品的分水岭。huashu-design 把它内化成了一个五步协议

用户输入需求
    ↓
1. 已有资产扫描(品牌色、字体、logo、过往设计)
    ↓
2. 方向选择(5 流派 × 20 哲学 → 推荐 3 个差异化方向)
    ↓
3. 并行生成 Demo(3 个方向同时跑,用户选)
    ↓
4. 精炼迭代(Tweaks 实时调参,多维度探索)
    ↓
5. 导出交付(HTML / PPTX / MP4 / PDF / PNG / SVG)

关键洞察:设计不是一次性生成,而是方向探索 → 选择 → 精炼 → 交付的流水线。

2.2 5 流派 × 20 设计哲学

这是 huashu-design 最让我感兴趣的部分。

设计方向不是随机生成的。花叔建立了一个设计哲学的坐标系

流派代表哲学
极简主义少即是多、留白叙事、功能决定形式
新粗野主义raw 美学、系统暴露、无装饰
赛博朋克霓虹对比、故障艺术、高密度信息
有机自然仿生形态、柔和渐变、自然纹理
古典优雅网格系统、衬线字体、对称平衡
每个流派下有 4 种具体哲学,总共 20 种。当用户输入模糊需求时,skill 不会直接开始设计,而是先从这 20 种里挑出 3 个差异化最大的方向,并行生成 Demo,让用户选择。

这不是装饰性的分类——它是设计决策的压缩表示。一个没有受过设计训练的用户,可能说不出"我想要新粗野主义",但看到 3 个并排的 Demo 后,他能指出来"这个感觉对"。

2.3 Anti-AI-Slop Checklist

花叔显然对 AI 生成的"设计垃圾"有痛感。skill 内置了一个 checklist,强制审查输出:

  • 配色是否只是蓝紫渐变?
  • 字体搭配是否有层次?
  • 信息密度是否过高/过低?
  • 动画是否只是无意义的 float-in?
  • 交互反馈是否清晰?
这个 checklist 不是事后加的,而是嵌入在生成流程中的门控机制。每一步生成后,skill 会自我审查,不通过就重做。

---

三、核心引擎:Stage + Sprite 时间轴模型

3.1 为什么需要专门的动画引擎?

大多数 AI 设计工具处理动画的方式是:生成 CSS transition 或 keyframes,然后交给浏览器渲染。

这有问题吗?对于简单过渡(fade、slide)没问题。但对于叙事性动画——比如一个产品发布视频,需要精确控制多个元素的入场时机、运动轨迹、缓动曲线——CSS 的表达能力不够。

花叔的解决方案:Stage + Sprite 时间片段模型

3.2 四 API 覆盖所有动画需求

// useTime:全局时间控制器
const time = useTime({ duration: 5000, fps: 25 });

// useSprite:创建动画元素
const hero = useSprite({
  from: { x: -100, opacity: 0 },
  to: { x: 0, opacity: 1 },
  easing: Easing.cubicOut,
  delay: 500
});

// interpolate:数值插值
const y = interpolate(0, 200, time.progress, Easing.spring);

// Easing:缓动函数库
// linear, quadIn, quadOut, cubicIn, cubicOut, elastic, spring, bounce...

这四个 API 的组合能力:

复杂度示例API 组合
简单淡入元素从透明到 opaqueuseSprite + Easing
多元素错开列表项依次滑入useTime + useSprite + delay
路径动画Logo 沿曲线运动useSprite + interpolate
物理效果弹性碰撞、弹簧Easing.spring / Easing.bounce
复合叙事产品发布完整视频Stage + 多个 Sprite + 时间轴

3.3 导出能力

动画引擎不仅用于预览,还直接驱动导出:

  • MP4:25fps 渲染,支持 60fps 插帧
  • GIF:palette 优化,控制文件大小
  • 带 BGM 的成片:合成音轨,一键导出
这意味着:你在 Claude Code 里说"把这段逻辑做成 60 秒动画,导出 MP4",skill 会自己生成动画、渲染视频、交付文件。不需要打开 After Effects,不需要学视频剪辑。

---

四、七大能力拆解

4.1 交互原型(App / Web)

交付物:单文件 HTML · 真 iPhone bezel · 可点击 · Playwright 验证 典型耗时:10–15 min

不是"看起来像 iPhone 的静态图"。是真 iPhone 15 Pro 机身比例(灵动岛、状态栏、Home Indicator),状态驱动的多屏导航,从 Wikimedia/Met/Unsplash 拉取真实图片,最后用 Playwright 自动点击测试验证交互链路。

为什么用 Playwright 验证?

因为 AI 生成的代码可能有 bug——点击按钮没反应、路由跳转失败、状态没更新。Playwright 作为自动化测试工具,可以在交付前自动跑一遍交互流程,确保原型是可用的,不是"看起来像那么回事"。

4.2 演讲幻灯片

交付物:HTML deck(浏览器演讲)+ 可编辑 PPTX(文本框保留) 典型耗时:15–25 min

HTML deck 可以直接在浏览器里演讲,不需要 PowerPoint。但 skill 同时用 html2pptx.js 读 DOM 的 computedStyle,逐元素翻译成 PowerPoint 对象。

关键:导出的是真文本框,不是图片。PPT 里双击即可编辑。

这解决了 AI 生成 PPT 的最大痛点:之前的工具要么导出图片(不可编辑),要么导出乱排版的文本。huashu-design 通过解析 computedStyle 来保证排版精度。

4.3 时间轴动画

交付物:MP4(25fps / 60fps 插帧)+ GIF(palette 优化)+ BGM 典型耗时:8–12 min

Stage + Sprite 引擎的核心应用场景。README 里的每一个动画(包括那个 25 秒的 hero 动画)都是 huashu-design 自己生成的。

4.4 设计变体(Tweaks)

交付物:3+ 并排对比 · 实时调参 · 跨维度探索 典型耗时:10 min

配色、字型、信息密度等参数化。侧边面板切换,纯前端 + localStorage 持久化,刷新不丢。

这是设计探索的工具。不是"生成一个设计",而是"生成一组设计,让用户在参数空间里探索"。

4.5 信息图 / 可视化

交付物:印刷级排版 · PDF / PNG / SVG 典型耗时:10 min

从数据到视觉的自动化。不是简单的图表库调用,而是排版引擎级别的处理——字体层次、留白节奏、色彩编码、信息层级。

4.6 设计方向顾问

交付物:5 流派 × 20 设计哲学 · 推荐 3 方向 · 并行生成 Demo 典型耗时:5 min

这是设计咨询的自动化。当需求模糊时,skill 不会盲目开始设计,而是先帮你定义方向

4.7 5 维度专家评审

交付物:雷达图 + Keep/Fix/Quick Wins · 可操作修复清单 典型耗时:3 min

五个评审维度: 1. 视觉层次:信息优先级是否清晰? 2. 色彩系统:配色是否服务于功能? 3. typography:字体搭配是否有层次? 4. 交互反馈:用户操作后是否有明确反馈? 5. 品牌一致性:是否符合品牌调性?

输出不是"好看/不好看",而是具体的修复清单——改哪里、怎么改、优先级如何。

---

五、与 Claude Design 的关系:两条路,两种人

花叔的定位很诚实:

维度Claude Designhuashu-design
形态Web 产品(浏览器里用)skill(Claude Code 里用)
配额订阅 quotaAPI 消耗 · 并行跑 agent 不受 quota 限
交付物画布内 + Figma 导出HTML / MP4 / GIF / 可编辑 PPTX / PDF
操作方式GUI(点、拖、改)对话(说话、等 agent 做完)
复杂动画有限Stage + Sprite 时间轴 · 60fps 导出
跨 agent专属 Claude.ai任意 skill 兼容 agent
核心区别

Claude Design 是更好的图形工具。它在浏览器里,有画布,有拖拽,有实时预览。适合视觉型思维的人。

huashu-design 是让图形工具这层消失。你在终端里说话,它交付文件。适合已经活在命令行里的人。

两条路,不同受众。没有优劣,只有场景。

---

六、局限的诚实

花叔在 README 里列出了三个明确局限,这种诚实比过度承诺更值得尊重:

6.1 不支持图层级 PPTX ↔ Figma 往返

产出是 HTML,可截图、录屏、导图,但不能拖进 Keynote 改文字位置。如果你想在 Figma 里微调,需要先截图再导入,丢失了矢量编辑能力。

6.2 Framer Motion 级别的复杂动画不行

3D、物理模拟、粒子系统超出 skill 边界。这不是技术限制,是范围选择——花叔选择了"够用"而不是"全能"。

6.3 空白品牌从零设计质量掉到 60–65 分

凭空画 hi-fi 本来就是 last resort。如果没有品牌资产(色板、字体、logo、过往设计)作为起点,AI 只能凭通用审美生成,质量自然下降。

这恰恰印证了 Core Asset Protocol 的核心原则:好的设计从上下文长出来,不是从白纸开始。

---

七、生态位置:被多个项目借鉴的设计哲学指南针

huashu-design 不仅是一个独立项目,它已经成为其他开源项目的设计哲学基础设施

例如 open-design(nexu-io/open-design)明确承认:

> huashu-design(花叔的画术)—— 设计哲学的指南针。Junior-Designer 工作流、5 步品牌资产协议、anti-AI-slop checklist、五维自评审、以及方向选择器背后的「5 流派 × 20 种设计哲学」思路 —— 全部蒸馏进我们的 discovery.ts。

这种被借鉴比 star 数更能说明价值。它意味着 huashu-design 定义了一套可复用的设计方法论,而不仅仅是一个工具。

---

八、我的判断

8.1 优势

1. Agent-agnostic 架构:不绑定任何特定 AI 平台,Claude Code、Cursor、OpenClaw 都能用。这是 skill 哲学的胜利——工具应该适配用户的工作流,而不是让用户迁移到工具的平台。

2. 设计方法论的内置:5 流派 × 20 哲学不是噱头,是设计决策的压缩表示。它让一个不懂设计的开发者也能做出有方向感的选择。

3. Stage + Sprite 引擎:独立动画引擎意味着 huashu-design 的动画能力不受浏览器 CSS 的限制。叙事性动画、产品发布视频——这些需要精确时间控制的任务,它是目前 AI 设计工具里能力最强的。

4. Playwright 验证:自动测试生成的原型,确保交付物是可用的。这种"自己验证自己"的闭环,是工程思维的体现。

5. 诚实的局限声明:不夸大能力范围,让用户有正确的预期。"80 分的 skill"的定位反而建立了信任。

8.2 局限

1. HTML 作为唯一输出格式:虽然可以导出多种格式,但"源文件"始终是 HTML。这意味着与专业设计工作流(Figma → 开发)的集成有断层。

2. 中文优先的提示词:skill 的提示词(SKILL.md、references/*.md)是中文的。虽然 agent 是双语的,但非中文用户可能在某些边缘场景遇到理解偏差。

3. 没有可视化调试:如果生成的设计不对,你只能说话调整,不能像 GUI 工具那样直接拖拽修改。对话式交互的迭代成本在某些场景下更高。

4. API 成本:不受 quota 限制的另一面是 API 消耗可能很高。复杂动画的渲染、多方向并行生成,都需要大量 token。

8.3 适用场景

场景推荐度原因
快速产品原型⭐⭐⭐⭐⭐单文件 HTML,可点击,真设备 bezel
内部演讲 PPT⭐⭐⭐⭐⭐HTML deck + 可编辑 PPTX,够用
产品发布动画⭐⭐⭐⭐⭐Stage + Sprite 引擎是差异化能力
品牌级设计交付⭐⭐⭐60-65 分的空白品牌质量不够
复杂 3D/物理动画明确超出范围
Figma 专业工作流⭐⭐不支持图层往返
---

九、参考信息

项目主页:https://github.com/alchaincyf/huashu-design 中文 README:https://github.com/alchaincyf/huashu-design/blob/master/README.zh.md 英文 README:https://github.com/alchaincyf/huashu-design/blob/master/README.en.md 安装npx skills add alchaincyf/huashu-design 作者:花叔(@AlchainHust)https://github.com/alchaincyf

相关项目

  • Claude Design(Anthropic):https://www.anthropic.com/claude-design
  • open-design(借鉴 huashu-design 哲学):https://github.com/nexu-io/open-design
  • guizang-ppt-skill(歸藏杂志风 PPT):https://github.com/op7418/guizang-ppt-skill
技术栈推断
  • HTML / CSS / JavaScript(核心输出格式)
  • Playwright(自动化测试)
  • html2pptx.js(PPTX 导出)
  • 自定义 Stage + Sprite 动画引擎
---

十、交叉引用

#huashu-design #花叔 #AI设计 #ClaudeCode #Skill #开源工具 #设计哲学 #动画引擎 #费曼风格 #技术解读

---

> 费曼检验:这篇文章解释了 huashu-design 是什么(Claude Code 里的设计 skill,不是浏览器工具)、它能做什么(7 项能力从原型到动画到评审)、核心引擎怎么工作(Stage + Sprite 时间轴模型)、与 Claude Design 的区别(GUI vs 对话,工具 vs 让工具消失)、以及为什么"5 流派 × 20 哲学"不是噱头(它是设计决策的压缩表示,让不懂设计的人也能做方向选择)。如果你读完觉得"这不就是一个 AI 做设计的工具吗",那我失败了——它不只是"做设计",它试图重新定义设计工具的形态

> 货物崇拜检测:文中提到的所有能力描述、时间估算、导出格式均来自项目 README。"80 分的 skill"是花叔自己的定位。"被 open-design 借鉴"来自该项目的致谢。Claude Design 的哲学来源是花叔自述。

---

*本文基于 GitHub 仓库公开资料整理,部分推断性观点属于作者分析,不代表项目作者或相关方立场。*

👍 1
💬 讨论回复 (1)
✨步子哥 #1 2026-05-16 09:38
👍 1
推荐

🌟 智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

🎁 领取 2000万 Tokens