redis持久化机制之RDB

redis之所以能支持10W/s的读写操作主要是依靠

1、所有数据都在内存。

2、单线程架构，避免了多线程可能产生的竞争为题。

3、使用c语言实现，距离操作系统更近。

4、redis的代码经过作者精打细磨及优雅与一身。

5、epoll模型io多路复用，将连接、读写、关闭都转换为事件，不在网络IO上浪费过多的时间

但是所有数据都存放在内存中，就带来一个问题，如果服务器突然宕机，那么内存中的数据会都丢失，所以需要对内存中的数据进行持久化处理，把内存中的数据存储在磁盘上，这样服务器在重启后redis就可以通过持久化在磁盘上的备份进行数据恢复。

redis支持两种持久化机制：RDB和AOF，下面将对这两种持久化机制进行介绍。

即把当前redis内存中的数据生成快照保存到硬盘，也称作snapshot机制。

对应命令save和bgsave：

save：会阻塞redis主线程直到RDB过程结束，内存占用越大的redis实例阻塞的时间就越久，由于redis读写操作都是通过主线程完成的，也就意味着在阻塞期间redis不能进行读写操作，不推荐使用。

bgsave：即在后台运行，RDB过程期间不会阻塞redis，原理是通过fork出一个子线程，由子线程完成RDB操作，但是在fork出子线程的阶段会阻塞redis主线程。如下图所示

redis持久化机制之RDB

除了手动触发bgsave之外，还有以下自动触发bgsave的操作：

1、save配置项：“save m n”，表示m秒内n个键被修改时自动触发bgsave

2、主从模式下从节点需要全量复制主节点的数据，主节点会自动触发bgsave生成RDB文件，通过网络传输给从节点

3、执行debug reload命令重新加载redis时

4、执行shutdown命令时如果没有开启AOF持久化机制则自动执行bgsave

RDB文件存放目录可以通过dir配置项进行指定，文件名可以通过dbfilename配置项指定，也可以通过客户端执行config set {dir}， config set dbfilename {filename}进行运行期动态指定

redis默认会使用LZF算法对生成的RDB文件进行压缩，减少磁盘空间的占用量，可以通过命令config set rdbcompression {yes|no}关闭或开启，默认开启。

如果redis在生成RDB文件时服务器宕机，则有可能生成的RDB文件不完整，redis在加载RDB文件时会对文件进行校验，如果RBD文件损坏则会拒绝启动并打印日志，此时可以使用redis-check-dump工具检测RDB文件。

RDB机制的优缺点：

优点：

1、RDB文件压缩后占用硬盘空间十分小，代表redis在某个时间点上的数据快照，适合用于备份及全量复制等。

2、redis加载RDB文件恢复数据的速度远远快于AOF

缺点：

1、实时性低，无法做到实时/秒级持久化，且每次执行bgsave都需要fork出子线程，属于重量级操作，频繁执行bgsave系统资源开销较大。

2、老版本redis无法兼容新版的RDB格式