rocksDB要点
rocksDB定义
快速存储系统,充分挖掘 Flash or RAM 硬件的读写特性,支持单个 KV 的读写以及批量读写。本质:牺牲了一部分读的性能和增加了合并的开销,换取了高效的写性能。
LSM-Tree(Log-Structured-Merge-Tree)的理解
- 简述:内存中构建“小树”,到一定的规模,Merge到磁盘的“大树”。
- 多level的文件格式:最热最新的数据L0层,最冷最老的数据LN层的布局,磁盘通过B树索引。
- B树+“有序文件集”批量写入(定义为同level)
- 数据按key有序,合并不同file、level上的数据时,类似merge-join。
基本文件格式
- memtable:内存文件数据格式,新数据进内存。
- sstfile:内容是有序的。
- logfile:
放大因子
- 写放大:例如,用户写入了10字节,但实际写到磁盘的有100字节。
- 读放大:例如,用户要读取一个page,但实际下面读取了3个pages。
- 空间放大:数据库可能是100 MB,但实际占用了200 MB的磁盘空间。