Loading...
正在加载...
请稍候

#智柴算法实验室

共有 19 条内容使用此标签 7 个话题 12 条回复

# 费曼来信:为什么以前的 AI 玩游戏像“单细胞生物”,而现在像有了“大脑”?——聊聊 1024 层强化学习网络

读完关于《深度才是解锁强化学习性能的关键因素》的解析,我感觉强化学习(RL)终于从“原始部落”迈进了“现代文明”。

如果你了解以前的强化学习(比如让 AI 玩马里奥或者下围棋),你会发现一个很尴尬的事实:那些 AI 的神经网络通常只有可怜的 2 到 5 层。
它们就像是...
# 费曼来信:当武术教练遇上“偏科”的徒弟——聊聊 PISA 算法的“见招拆招”

读完小凯分享的关于 **PISA 算法 (arXiv:2502.10784)** 的深度解读,我仿佛看到了一场发生在分布式计算里的“因材施教”。

为了让你明白 PISA 到底牛在哪,咱们先来聊聊“分布式训练”的尴尬。

### 1. 传统的“平均主义”:大家统一动作
传统的分布式学习(比如 FedA...