⾼性能IO模型：为什么单线程Redis能那么快

Redis是单线程，主要是指Redis的⽹络IO和键值对读写是由⼀个线程来完成的，这也是Redis对外提供键值存储服务的主要流程。但Redis的其他功能，⽐如持久化、异步删除、集群数据同步等，其实是由额外的线程执⾏的。

1.为什么使用单线程？

1.1 多线程开销

系统中通常会存在被多线程同时访问的共享资源，⽐如⼀个共享的数据结构。当有多个线程要修改这个共享资源时，为了保证共享资源的正确性，就需要有额外的机制进⾏保证，⽽这个额外的机制，就会带来额外的开销。

Redis有List的数据类型，并提供出队（LPOP）和⼊队（LPUSH）操作。假设Redis采⽤多线程设计，为了保证队列⻓度的正确性，Redis需要让线程A和B的LPUSH和LPOP串⾏执⾏，这样⼀来，Redis可以⽆误地记录它们对List⻓度的修改。否则，我们可能就会得到错误的⻓度结果。这就是多线程编程模式⾯临的共享资源的并发访问控制问题。

并发访问控制⼀直是多线程开发中的⼀个难点问题，如果没有精细的设计，⽐如说，只是简单地采⽤⼀个粗粒度互斥锁，就会出现不理想的结果：即使增加了线程，⼤部分线程也在等待获取访问共享资源的互斥锁，并⾏变串⾏，系统吞吐率并没有随着线程的增加⽽增加。

1.2 单线程为什么快？

Redis的⼤部分操作在内存上完成，再加上它采⽤了⾼效的数据结构，例如哈希表和跳表，这是它实现⾼性能的⼀个重要原因。
Redis采⽤了多路复⽤机制，使其在⽹络IO操作中能并发处理⼤量的客⼾端请求，实现⾼吞吐率。

1.2.1 多路复用机制

Linux中的IO多路复⽤机制是指⼀个线程处理多个IO流，就是我们经常听到的select/epoll机制。简单来说，在Redis只运⾏单线程的情况下，该机制允许内核中，同时存在多个监听套接字和已连接套接字。内核会⼀直监听这些套接字上的连接请求或数据请求。⼀旦有请求到达，就会交给Redis线程处理，这就实现了⼀个Redis线程处理多个IO流的效果。

下图就是基于多路复⽤的Redis IO模型。图中的多个FD就是刚才所说的多个套接字。Redis⽹络框架调⽤epoll机制，让内核监听这些套接字。此时，Redis线程不会阻塞在某⼀个特定的监听或已连接套接字上，既，不会阻塞在某⼀个特定的客⼾端请求处理上。正因为此，Redis可以同时和多个客⼾端连接并处理请求，从⽽提升并发性。

select/epoll⼀旦监测到FD上有请求到达时，就会触发相应的事件。
事件会被放进⼀个事件队列，Redis单线程对该事件队列不断进⾏处理。
同时，Redis在对事件队列中的事件进⾏处理时，会调⽤相应的处理函数，这就实现了基于事件的回调。因为Redis⼀直在对事件队列进⾏处理，所以能及时响应客⼾端请求，提升Redis的响应性能。

Redis单线程处理IO请求性能瓶颈：

1、任意⼀个请求在server中⼀旦发⽣耗时，都会影响整个server的性能

1.1：操作bigkey：写⼊⼀个bigkey在分配内存时需要消耗更多的时间，同样，删除bigkey释放内存同样会产⽣耗时；

1.2：使⽤复杂度过⾼的命令：例如SORT/SUNION/ZUNIONSTORE，或者O(N)命令，但是N很⼤，例如lrange key 0 -1⼀次查询全量数据；

1.3：⼤量key集中过期：Redis的过期机制也是在主线程中执⾏的，⼤量key集中过期会导致处理⼀个请求时，耗时都在删除过期key，耗时变⻓；

1.4：⼤量key集中过期：Redis的过期机制也是在主线程中执⾏的，⼤量key集中过期会导致处理⼀个请求时，耗时都在删除过期key，耗时变⻓；

1.5：AOF刷盘开启always机制：每次写⼊都需要把这个操作刷到磁盘，写磁盘的速度远⽐写内存慢，会拖慢Redis的性能；

1.6：主从全量同步⽣成RDB：虽然采⽤fork⼦进程⽣成数据快照，但fork这⼀瞬间也是会阻塞整个线程的，实例越⼤，阻塞时间越久；

2、并发量⾮常⼤时，单线程读写客⼾端IO数据存在性能瓶颈，虽然采⽤IO多路复⽤机制，但是读写客⼾端数据依旧是同步IO，只能单线程依次读取客⼾端的数据，⽆法利⽤到CPU多核。