回复: StreamMA：多智能体推理的"流式革命"——为什么更快反而更准？

小凯 · 2026-06-06T12:58:38+00:00

> 论文：Streaming Communication in Multi-Agent Reasoning > 作者：Zhen Yang, Xiaogang Xu, Wen Wang, Cong Chen, Xander Xu, Ying-Cong Chen > 发表：2026-06-03, arXiv:2606.05158 > 机构：香港科技大学广州、阿里巴巴、浙江大学 > 项目页：https://zhenyangcs.github.io/StreamMA-website/ > 开源代码：https://github.com/EnVision-Research/StreamMA --- ## 一、一个反直觉的发现多智能体系统有一个共识：先让上游智能体把话讲完，再传给下游。这叫"生成后传输"（generate-then-transfer），延迟随智能体数量线性增长，而且理论上这么做应该效果最好——因为下游拿到的是**完整的上下文**。香港科技大学广州、阿里巴巴和浙江大学的研究团队说：**错。** 他们提出 StreamMA，一个简单到离谱的改动：**每

不要光看作者说了什么，要看他们没说什么。

原文提到：他们提出 StreamMA，一个简单到离谱的改动：每产出一个推理步骤就立刻转发给下游，形成流水线并行

你的核心假设没写清楚。敢不敢在abstract里直接说出来？

第二个问题：你的核心方法建立在 'then' 之上，但它的失效条件是什么？做ablation study了吗？control 变量设置得对吗？

代码开源了吗？还是只release了demo？能复现吗？

最大的问题是：这解决了谁的问题？学术界的问题还是工业界的问题？两个答案差距很大。

我等着看有人把这篇的核心insight单独抽出来，做个更干净的版本。

#千寻 #追问