OpenFugu:0.6B 开源复刻版,把 Fugu 的编排黑盒拆成透明说明书
一句话:Sakana 卖了一个黑盒,社区把它拆成了透明说明书
Sakana AI 的 Fugu 号称"一模型指挥所有 LLM",但它是闭源的——你知道它能编排,却不知道它怎么编排。OpenFugu 干了一件狠事:从两篇论文 + 公开检查点开始,把整个机制完整复刻出来,用 Apache-2.0 开源,本地可跑。
核心架构:编排器自己从不回答
这是 Fugu(以及 OpenFugu)最反直觉的设计:
用户提问 → 0.6B 编排器(Qwen3-0.6B)→ 产生一个 hidden state → 线性 head 打分 → 选择 worker → 返回 worker 的回答
编排器本身从不直接回答用户。它只做一个决定:这个任务该派给哪个 worker。
| 组件 | 参数规模 | 角色 |
|---|---|---|
| 编排器 backbone(Qwen3-0.6B) | ~0.6B | 读取用户输入,产生 hidden state |
| 线性选择 head | 极小 | 基于 hidden state 为每个 worker 打分 |
| 可训练参数总量 | ~19.5K | head + 9 个矩阵的 SVD 偏移量 |
| Worker 模型池 | 不固定 | GPT、Claude、Gemini、DeepSeek 等 |
训练:无梯度优化 + GRPO 强化学习
OpenFugu 的 TRINITY 协调器训练使用 sep-CMA-ES(分离协方差矩阵自适应进化策略),一种无梯度优化方法。好处:不需要反向传播,不碰 worker 模型权重,只优化编排器的选择策略。
Conductor(Fugu-Ultra 的 DAG 编排器)用 GRPO(Group Relative Policy Optimization)训练:
- 在 ToolScale 数据集上微调 Llama-3.2-3B-Instruct
- Reward 从 1.21 → 1.64(100 steps)
- 训练后的 Conductor 发布在 HuggingFace:
di-zhang-fdu/openfugu-conductor-3b
关键数字
| 指标 | 数值 | 说明 |
|---|---|---|
| 权重自检 | 95% / 100% | 37-case fixture 上,95% agent 选择正确,100% role 分配正确 |
| 性能提升 | +107% | 训练后的编排器 vs 最佳单 worker(query-level routing) |
| 训练 reward | 1.21 → 1.64 | GRPO 训练 100 steps 的 reward 曲线 |
| 端到端验证 | PASS | 从训练到部署到回答验证,完整 pipeline 可跑通 |
四阶段完整 Pipeline
OpenFugu 不是 demo,是完整的生产系统:
1. read:反向工程文档(docs/HOW_FUGU_IS_IMPLEMENTED.md),每句话带证据等级(EXEC/CODE/DATA)
2. run:mini.py --self-test 验证重建是否忠于原检查点(95%/100%)
3. train:从 scratch 训练 TRINITY 协调器,或用 GRPO 训练 Conductor
4. serve:serve.py 暴露 OpenAI 兼容 API(/v1/chat/completions),内部调用 worker pool
为什么这比原版 Fugu 更有意义?
| 维度 | Sakana Fugu(官方) | OpenFugu(开源复刻) |
|---|---|---|
| 权重 | 闭源,商业产品 | 完整开源,Apache-2.0 |
| 部署 | 云端 API | 本地可跑,CPU 也行 |
| 可验证性 | 信官方数据 | 自己跑自检,自己看代码 |
| 可扩展性 | 用 Sakana 的 pool | 换自己的 worker 池,任意模型 |
| 研究价值 | 产品级 | 教科书级:从论文到系统的完整实现 |
最小可运行 demo
pip install -r requirements.txt
python scripts/fetch_artifacts.py # 拉 Qwen3-0.6B + 检查点
# 本地验证
python openfugu/mini.py --self-test # -> 95% / 100%
# 部署服务
python openfugu/serve.py --slot-models "gpt-4,claude-opus" --port 8088
# 像调用一个模型一样调用整个编排系统
curl localhost:8088/v1/chat/completions \
-H 'Content-Type: application/json' \
-d '{"messages":[{"role":"user","content":"flatten a nested list in one line"}]}'
一句话总结
Sakana 证明了编排器能赢过单模型,OpenFugu 证明了一个本科生就能从论文里把这个编排器造出来。这才是开源社区的力量——不是复刻一个产品,而是复刻一种可能性。
---
GitHub: trotsky1997/OpenFugu
论文: arXiv:2606.21228
HuggingFace: di-zhang-fdu/openfugu-conductor-3b
协议: Apache-2.0(代码),Llama 3.2 Community License(训练权重)
#OpenFugu #SakanaAI #LLM编排 #开源复刻 #多智能体系统 #Fugu #TRINITY #Conductor #GRPO #Apache-2.0 #模型编排
🌟 智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
🎁 领取 2000万 Tokens