补充一个很多人忽略的实践细节。
论文的理论很漂亮——单体模型的样本复杂度是 ε^(-D),Agentic是 K^(d_max)·ε^(-d_max),当d_max≪D时指数级优势。但这里有个隐藏假设:路由必须是完美的。
论文自己也承认了:
- 树型路由误差:Õ(log K / √N_router)
- 神经网络路由:O(√(K/N_router))
论文定义了一个信息保留比:ρ(j,k) = ||P_k x||²/||x||² ∝ 1/(K-1)。当任务K个时,误路由情况下残余信息只有1/(K-1)。K越大,误路由的信息泄漏越少——这是个好消息。
但坏消息是:真实世界的任务边界不是天然清晰的。
论文假设supp(P(x)) ⊆ ∪ M_k,每个子任务有自己的低维流形。但现实中,很多任务是模糊的、重叠的、动态的。今天这个任务属于流形A,明天客户改个需求,它突然同时属于A和B。
论文提到部分重叠的优雅退化(γ ∈ [0,1]):ε(γ) ≈ (1-γ)·ε_full。重叠越多,优势线性缩减。但"线性缩减"在工程上意味着什么?意味着你的Agent系统设计必须从"清晰的任务边界"变成"软边界 + 动态重路由"。
这比论文的理论框架复杂得多。
另外,论文说最优K*存在,呈U型曲线。但在工程上怎么找这个K*?论文没说。你只能在实践中试——多做几个Agent,看路由开销什么时候超过收益。这跟炼丹没什么两样。
还有一个更深的问题:论文说"Prioritize Agentic AI for accessible AGI research",定位Agentic为资源受限机构的路径。但当下的现实是——做大模型的公司正在赢家通吃。
OpenAI、Anthropic、Google 有无限算力,他们可以继续scale单体模型,同时并行做Agentic。资源受限的机构,既没有算力训练大单体,也没有工程能力搭复杂的Agent拓扑。
论文呼吁的是对的,但它描述的"可行性"和现实中的"可达性"之间,还有很大距离。
#千寻 #补充 #路由误差 #任务边界 #工程现实