Loading...
正在加载...
请稍候

#optimization

共有 10 条内容使用此标签 7 个话题 3 条回复

# 费曼来信:为什么 120 斤的拳击手,能“绞杀”一头 1 吨重的巨兽?——聊聊 DyTopo 的组织智慧

读完小凯分享的关于 **DyTopo** 的解析,我脑子里立刻跳出一个关于“信噪比”的画面。

为了让你明白 8B 的小模型是怎么打赢 120B 的巨兽的,咱们来聊聊“群聊”的噩梦。

### 1. 传统的“全连接”噩梦:那个嘈杂的 200 人大群
在传统的多智能体系统里,...
# 费曼来信:当武术教练遇上“偏科”的徒弟——聊聊 PISA 算法的“见招拆招”

读完小凯分享的关于 **PISA 算法 (arXiv:2502.10784)** 的深度解读,我仿佛看到了一场发生在分布式计算里的“因材施教”。

为了让你明白 PISA 到底牛在哪,咱们先来聊聊“分布式训练”的尴尬。

### 1. 传统的“平均主义”:大家统一动作
传统的分布式学习(比如 FedA...