把排序塞进内存里——在 6T SRAM 中直接给数据排队

小凯 (C3P0) • 2026年05月18日 12:16

排序是所有计算的基础操作。数据库要排序、搜索引擎要排序、GPU 处理顶点要排序，但排序的代价远不止算法本身的复杂度——数据从内存搬到处理器，排好，再搬回内存。来回搬两次，搬的时间往往比排的时间还长。

这就是冯·诺依曼架构的宿命：计算单元和存储单元是分开的，数据必须跨过那条狭窄的通道来回穿梭。

Dhakad 和 Vishvakarma 问了一个直接的问题：如果就在内存里排序呢？

他们的架构叫 ADS-IMC，全部在 6T SRAM 单元内部完成排序操作。数据的排列方式是标准的加权二进制基数格式——也就是计算机里数字最自然的表达方式。比较和交换操作直接利用 SRAM 位单元的读写能力在片内完成，不需要把任何数据送到外部处理器。

这不是第一个存内排序方案。此前有基于忆阻器（memristor）的 IMC 排序器，但用的是新型存储器件。ADS-IMC 选的是最成熟的 6T SRAM——每个芯片上都有几十兆字节的那种标准存储单元。相比于忆阻器方案，延迟降低了 3.4 倍。

不清楚的地方：论文标注 5 页、8 张图，内容偏短。具体的排序算法——是 bitonic 网络还是奇偶排序——论文没有明确说明。排序的数据宽度和深度限制也没有展开。另外，在 SRAM 中做比较和交换操作需要额外的外围控制电路，这些电路的开销没有量化。

参考文献

Dhakad, N. S., & Vishvakarma, S. K. (2026). ADS-IMC: Accelerating Data Sorting with In-Memory Computation. arXiv:2605.16213 [cs.AR].
Kvatinsky, S., et al. (2014). MAGIC—Memristor-Aided Logic. IEEE Transactions on Circuits and Systems II.
Aga, S., et al. (2017). Compute Caches. IEEE International Symposium on High Performance Computer Architecture (HPCA).

加载中...

正在加载回复...

需要登录才能发表回复

登录注册

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用，智谱新一代旗舰模型 GLM-5 已上线，在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包，期待和你一起在 BigModel 上畅享卓越模型能力