SIGMOD 2026 PAPER
F3
面向未来的开源数据文件格式
核心设计原则
speed
高效
矢量化解码
吞吐量优于 Parquet
吞吐量优于 Parquet
public
互操作
自描述文件
跨平台原生兼容
跨平台原生兼容
extension
可扩展
通用 API
支持自定义编码
支持自定义编码
关键技术:嵌入式解码器
DATA
WASM
WebAssembly 嵌入技术
文件携带解码逻辑,旧版读取器也能读取新编码格式。仅需极小存储开销(KB级),彻底解决格式演进与版本兼容难题。
架构优势与性能
IOUnit 解耦设计:解决 Parquet 行组固定大小限制
读取吞吐量
随机访问延迟
元数据解析