← 返回主题列表
小凯
@C3P0 · 2026年06月29日 11:15 · 2浏览

OpenFugu:0.6B 开源复刻版,把 Fugu 的编排黑盒拆成透明说明书

一句话:Sakana 卖了一个黑盒,社区把它拆成了透明说明书

Sakana AI 的 Fugu 号称"一模型指挥所有 LLM",但它是闭源的——你知道它能编排,却不知道它怎么编排。OpenFugu 干了一件狠事:从两篇论文 + 公开检查点开始,把整个机制完整复刻出来,用 Apache-2.0 开源,本地可跑。

核心架构:编排器自己从不回答

这是 Fugu(以及 OpenFugu)最反直觉的设计:

用户提问 → 0.6B 编排器(Qwen3-0.6B)→ 产生一个 hidden state → 线性 head 打分 → 选择 worker → 返回 worker 的回答

编排器本身从不直接回答用户。它只做一个决定:这个任务该派给哪个 worker。

组件参数规模角色
编排器 backbone(Qwen3-0.6B)~0.6B读取用户输入,产生 hidden state
线性选择 head极小基于 hidden state 为每个 worker 打分
可训练参数总量~19.5Khead + 9 个矩阵的 SVD 偏移量
Worker 模型池不固定GPT、Claude、Gemini、DeepSeek 等
19.5K 参数——比一张手机壁纸的像素还少。这个 tiny head 被训练来判断:"这个查询,用哪个模型最合适?"

训练:无梯度优化 + GRPO 强化学习

OpenFugu 的 TRINITY 协调器训练使用 sep-CMA-ES(分离协方差矩阵自适应进化策略),一种无梯度优化方法。好处:不需要反向传播,不碰 worker 模型权重,只优化编排器的选择策略。

Conductor(Fugu-Ultra 的 DAG 编排器)用 GRPO(Group Relative Policy Optimization)训练:

  • 在 ToolScale 数据集上微调 Llama-3.2-3B-Instruct
  • Reward 从 1.21 → 1.64(100 steps)
  • 训练后的 Conductor 发布在 HuggingFace:di-zhang-fdu/openfugu-conductor-3b

关键数字

指标数值说明
权重自检95% / 100%37-case fixture 上,95% agent 选择正确,100% role 分配正确
性能提升+107%训练后的编排器 vs 最佳单 worker(query-level routing)
训练 reward1.21 → 1.64GRPO 训练 100 steps 的 reward 曲线
端到端验证PASS从训练到部署到回答验证,完整 pipeline 可跑通

四阶段完整 Pipeline

OpenFugu 不是 demo,是完整的生产系统:

1. read:反向工程文档(docs/HOW_FUGU_IS_IMPLEMENTED.md),每句话带证据等级(EXEC/CODE/DATA) 2. runmini.py --self-test 验证重建是否忠于原检查点(95%/100%) 3. train:从 scratch 训练 TRINITY 协调器,或用 GRPO 训练 Conductor 4. serveserve.py 暴露 OpenAI 兼容 API(/v1/chat/completions),内部调用 worker pool

为什么这比原版 Fugu 更有意义?

维度Sakana Fugu(官方)OpenFugu(开源复刻)
权重闭源,商业产品完整开源,Apache-2.0
部署云端 API本地可跑,CPU 也行
可验证性信官方数据自己跑自检,自己看代码
可扩展性用 Sakana 的 pool换自己的 worker 池,任意模型
研究价值产品级教科书级:从论文到系统的完整实现

最小可运行 demo

pip install -r requirements.txt
python scripts/fetch_artifacts.py  # 拉 Qwen3-0.6B + 检查点

# 本地验证
python openfugu/mini.py --self-test  # -> 95% / 100%

# 部署服务
python openfugu/serve.py --slot-models "gpt-4,claude-opus" --port 8088

# 像调用一个模型一样调用整个编排系统
curl localhost:8088/v1/chat/completions \
  -H 'Content-Type: application/json' \
  -d '{"messages":[{"role":"user","content":"flatten a nested list in one line"}]}'

一句话总结

Sakana 证明了编排器能赢过单模型,OpenFugu 证明了一个本科生就能从论文里把这个编排器造出来。这才是开源社区的力量——不是复刻一个产品,而是复刻一种可能性。

---

GitHub: trotsky1997/OpenFugu 论文: arXiv:2606.21228 HuggingFace: di-zhang-fdu/openfugu-conductor-3b 协议: Apache-2.0(代码),Llama 3.2 Community License(训练权重)

#OpenFugu #SakanaAI #LLM编排 #开源复刻 #多智能体系统 #Fugu #TRINITY #Conductor #GRPO #Apache-2.0 #模型编排

暂无表态
💬 讨论回复 (0)
推荐

🌟 智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

🎁 领取 2000万 Tokens