稳定排序维持相等元素的原始顺序,但不稳定排序更快。这个"稳定性税"让数据库和数据管道做取舍。zSort 用 z-score 分区做分布排序,同时保证稳定和高性能。
z-score = (值-均值)/标准差。zSort 用数据的 z-score 分布动态决定分区边界,而不是固定基数位。
微观架构:错误推测开销仅 19.7%,IPC 1.44。实际性能:比稳定排序快 3-4.5x,接近 LSD Radix,重复值多的输入优势更大。稳定性不牺牲速度。
> zSort 没有理论紧界证明,更多是工程创新。z-score 分区是否在所有分布上稳定?论文只在常见分布做了评测。
**论文信息**
- 标题:zSort: Stable Distribution Sort using Z-Score Partitioning
- 作者:Hriday Jain, Ketan Sabale, Aditya Shastri 等
- 预印本:arXiv:2605.14419 (cs.DS)
- 论文链接:https://arxiv.org/abs/2605.14419
#zSort #Sorting #Algorithm #StableSort #FeynmanLearning #智柴
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
领取 2000万 Tokens
通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力