redis持久化机制之RDB
redis之所以能支持10W/s的读写操作主要是依靠
1、所有数据都在内存。
2、单线程架构,避免了多线程可能产生的竞争为题。
3、使用c语言实现,距离操作系统更近。
4、redis的代码经过作者精打细磨及优雅与一身。
5、epoll模型io多路复用,将连接、读写、关闭都转换为事件,不在网络IO上浪费过多的时间
但是所有数据都存放在内存中,就带来一个问题,如果服务器突然宕机,那么内存中的数据会都丢失,所以需要对内存中的数据进行持久化处理,把内存中的数据存储在磁盘上,这样服务器在重启后redis就可以通过持久化在磁盘上的备份进行数据恢复。
redis支持两种持久化机制:RDB和AOF,下面将对这两种持久化机制进行介绍。
RDB:
即把当前redis内存中的数据生成快照保存到硬盘,也称作snapshot机制。
对应命令save和bgsave:
save:会阻塞redis主线程直到RDB过程结束,内存占用越大的redis实例阻塞的时间就越久,由于redis读写操作都是通过主线程完成的,也就意味着在阻塞期间redis不能进行读写操作,不推荐使用。
bgsave:即在后台运行,RDB过程期间不会阻塞redis,原理是通过fork出一个子线程,由子线程完成RDB操作,但是在fork出子线程的阶段会阻塞redis主线程。如下图所示
除了手动触发bgsave之外,还有以下自动触发bgsave的操作:
1、save配置项:“save m n”,表示m秒内n个键被修改时自动触发bgsave
2、主从模式下从节点需要全量复制主节点的数据,主节点会自动触发bgsave生成RDB文件,通过网络传输给从节点
3、执行debug reload命令重新加载redis时
4、执行shutdown命令时如果没有开启AOF持久化机制则自动执行bgsave
RDB文件存放目录可以通过dir配置项进行指定,文件名可以通过dbfilename配置项指定,也可以通过客户端执行config set {dir}, config set dbfilename {filename}进行运行期动态指定
redis默认会使用LZF算法对生成的RDB文件进行压缩,减少磁盘空间的占用量,可以通过命令config set rdbcompression {yes|no}关闭或开启,默认开启。
如果redis在生成RDB文件时服务器宕机,则有可能生成的RDB文件不完整,redis在加载RDB文件时会对文件进行校验,如果RBD文件损坏则会拒绝启动并打印日志,此时可以使用redis-check-dump工具检测RDB文件。
RDB机制的优缺点:
优点:
1、RDB文件压缩后占用硬盘空间十分小,代表redis在某个时间点上的数据快照,适合用于备份及全量复制等。
2、redis加载RDB文件恢复数据的速度远远快于AOF
缺点:
1、实时性低,无法做到实时/秒级持久化,且每次执行bgsave都需要fork出子线程,属于重量级操作,频繁执行bgsave系统资源开销较大。
2、老版本redis无法兼容新版的RDB格式