Redis是单线程,主要是指Redis的⽹络IO和键值对读写是由⼀个线程来完成的,这也是Redis对外提供键值存储服务的主要流程。但Redis的其他功能,⽐如持久化、异步删除、集群数据同步等,其实是由额外的线程执⾏的。
1.为什么使用单线程?
1.1 多线程开销
 
0
系统中通常会存在被多线程同时访问的共享资源,⽐如⼀个共享的数据结构。当有多个线程要修改这个共享资源时,为了保证共享资源的正确性,就需要有额外的机制进⾏保证,⽽这个额外的机制,就会带来额外的开销。
Redis有List的数据类型,并提供出队(LPOP)和⼊队(LPUSH)操作。假设Redis采⽤多线程设计,为了保证队列⻓度的正确性,Redis需要让线程A和B的LPUSH和LPOP串⾏执⾏,这样⼀来,Redis可以⽆误地记录它们对List⻓度的修改。否则,我们可能就会得到错误的⻓度结果。这就是多线程编程模式⾯临的共享资源的并发访问控制问题。
并发访问控制⼀直是多线程开发中的⼀个难点问题,如果没有精细的设计,⽐如说,只是简单地采⽤⼀个粗粒度互斥锁,就会出现不理想的结果:即使增加了线程,⼤部分线程也在等待获取访问共享资源的互斥锁,并⾏变串⾏,系统吞吐率并没有随着线程的增加⽽增加。
 
1.2 单线程为什么快?
  • Redis的⼤部分操作在内存上完成,再加上它采⽤了⾼效的数据结构,例如哈希表和跳表,这是它实现⾼性能的⼀个重要原因。
  • Redis采⽤了多路复⽤机制,使其在⽹络IO操作中能并发处理⼤量的客⼾端请求,实现⾼吞吐率。
 
1.2.1 多路复用机制
Linux中的IO多路复⽤机制是指⼀个线程处理多个IO流,就是我们经常听到的select/epoll机制。简单来说,在Redis只运⾏单线程的情况下,该机制允许内核中,同时存在多个监听套接字和已连接套接字。内核会⼀直监听这些套接字上的连接请求或数据请求。⼀旦有请求到达,就会交给Redis线程处理,这就实现了⼀个Redis线程处理多个IO流的效果。
下图就是基于多路复⽤的Redis IO模型。图中的多个FD就是刚才所说的多个套接字。Redis⽹络框架调⽤epoll机制,让内核监听这些套接字。此时,Redis线程不会阻塞在某⼀个特定的监听或已连接套接字上,既,不会阻塞在某⼀个特定的客⼾端请求处理上。正因为此,Redis可以同时和多个客⼾端连接并处理请求,从⽽提升并发性。
 

 

 

  • select/epoll⼀旦监测到FD上有请求到达时,就会触发相应的事件。
  • 事件会被放进⼀个事件队列,Redis单线程对该事件队列不断进⾏处理。
  • 同时,Redis在对事件队列中的事件进⾏处理时,会调⽤相应的处理函数,这就实现了基于事件的回调。因为Redis⼀直在对事件队列进⾏处理,所以能及时响应客⼾端请求,提升Redis的响应性能。
 
 
Redis单线程处理IO请求性能瓶颈:
 
1、任意⼀个请求在server中⼀旦发⽣耗时,都会影响整个server的性能
1.1:操作bigkey:写⼊⼀个bigkey在分配内存时需要消耗更多的时间,同样,删除bigkey释放内存同样会产⽣耗时;
1.2:使⽤复杂度过⾼的命令:例如SORT/SUNION/ZUNIONSTORE,或者O(N)命令,但是N很⼤,例如lrange key 0 -1⼀次查询全量数据;
1.3:⼤量key集中过期:Redis的过期机制也是在主线程中执⾏的,⼤量key集中过期会导致处理⼀个请求时,耗时都在删除过期key,耗时变⻓;
1.4:⼤量key集中过期:Redis的过期机制也是在主线程中执⾏的,⼤量key集中过期会导致处理⼀个请求时,耗时都在删除过期key,耗时变⻓;
1.5:AOF刷盘开启always机制:每次写⼊都需要把这个操作刷到磁盘,写磁盘的速度远⽐写内存慢,会拖慢Redis的性能;
1.6:主从全量同步⽣成RDB:虽然采⽤fork⼦进程⽣成数据快照,但fork这⼀瞬间也是会阻塞整个线程的,实例越⼤,阻塞时间越久;
2、并发量⾮常⼤时,单线程读写客⼾端IO数据存在性能瓶颈,虽然采⽤IO多路复⽤机制,但是读写客⼾端数据依旧是同步IO,只能单线程依次读取客⼾端的数据,⽆法利⽤到CPU多核。