miller
发布于

惊群效应

原文地址 blog.csdn.net

什么是惊群效应

这个话题来自一个面试,当问到 Socket 编程中的 accept() 是否有惊群问题,引深又问到 epoll 多路复用中 epoll_wait() 是否有惊群问题。因为没有准备背过八股文,突然问到这个问题,还是稍微有点措手不及,当然就没有背过的那么快速干脆了,而对方在强调结果,也没给我思考分析的时间,我还在仔细回想这个里哪里存在惊群问题的时候,对方已经打断我说好了。所以这里就记录分析一下,到底什么是惊群效应,以及在并发编程中的应对方式。

简单粗暴理解,惊群效应就是,给一堆睡觉的鸟群 (羊群、牛群都行,随你高兴) 中,扔一颗石子,结果就是会惊醒这一群的鸟,这就是所谓的惊群效应。

对应到并发编程中,当多个线程阻塞到相同资源上 (比如锁) 时,当这个资源 ready 后,资源就绪的信号唤醒了所有阻塞到这个资源上的所有线程。

以锁为例,说明一下惊群的问题。比如某一个时刻 lock1 被其他线程占用,这个时候线程 A、线程 B、线程 C 来获取锁 lock1,则就都会被阻塞在 lock1 的阻塞队列中。当 lock1 被释放的时候,那么就会唤醒所有的阻塞在 lock1 上的线程 (这个不一定是唤醒所有线程,不同实现方式是有不一样的,java 的锁实现是唤醒所有线程的)。当线程 A、线程 B、线程 C 都被唤醒后,他们干的第一件事就是去争抢 lock1,最终只会有一个线程成功获取锁 (加入是线程 A),那么其他线程就又会重新被阻塞住,所以线程 B、线程 C 被唤醒啥也没干成,又被阻塞了。

要知道,线程的唤醒、挂起,都是需要通过系统调用的,操作系统也需要有一系列的动作老完成线程状态的转换,比如将线程从 lock1 阻塞队列中出队,然后放到 cpu 的就绪队列中,然后将线程状态变成 running,然后操作系统的 cpu 调度就才能给就绪队列中的线程分配 cpu。挂起线程,同样是需要逆向的这一些列动作的。然而对于线程 B、线程 C 唤醒 / 挂起,这些操作都是无用的,是对资源的浪费。当并发非常大,线程争抢一个锁的竞争非常大,那么就会有非常多的这种无用的唤醒 / 挂起,cpu 飙高了,但是业务响应反而变慢了。那么这个时候观察系统,会发现上下文切换变多了、中断也变多了。

总结起来就是:在并发编程中,当有多个线程 / 进程争抢同一资源,因资源不足而被阻塞的时,当阻塞事件解除后,如果唤醒了所有阻塞在该事件上的所有线程 / 进程,那就触发了惊群效应。

惊群效应的应对

在并发编程中,之所以出现了并发安全问题,是因为多个线程同时去修改相同的资源,所以随之而来的应对线程安全问题就是破坏这个条件,所以到处都会告诉你,应对并发安全问题:

  1. 不可变。这里破坏的就是 "修改" 这个条件。都不可变了,肯定是就没有问题了。但是这个应用场景其实是非常有限的,毕竟一个应用中,真的完全不变的数据并不是很多。但是在 java 变成中,要实现不可变,就得小心了,不是加个 final 修饰符就是不可变了,最稳妥的方式就是封装起来不听过任何修改方法,初始化后就不能该。
  2. 线程同步。这个破坏的就是 "多个" 条件。通过线程同步的方式,保证同一时刻只有一个线程去修改资源,其实就变成串行的了,自然也就不会有并发安全问题了。这也是最直观、最简单、实际生产中用的最多的方式了。所以几乎是只要提到线程安全,第一反应就是加锁,以至于如果谁深入思考后使用不可变 / 不共享来解决并发安全问题,要么就是被认为是不靠谱、要么就被认为是高阶操作。不过确实:加锁相对来说是更不容易出错一些,而不共享往往容易跌坑里。
  3. 不共享。这个破坏的就是 "相同资源" 的条件。只要不修改相同的资源,那么肯定就没有并发安全的问题了。但是只要说到不共享,第一反应肯定就是 ThreadLocal,但是好像也只能想到 ThreadLocal。而这里主要就想想要把不共享的思路打开。也从这个角度看下怎么去解决惊群效应。

对于不共享,ThreadLocal 其实就是给每个线程一个副本,自己玩自己的,那就不会共享了。把视角拉高一点,如果多个线程同时去修改相同的资源这句话中的资源,是可切分的、或者部分可切分呢?那是不是说当一个线程来修改的时候,就给这个线程分配一部分、让这个线程独占,依次类推 (当然,这里只是说的思路,实际实现的时候可能还是得配合锁)

JDK 中的例子就是 LongAddr,它的基本思想就是将一个数分成了量大部分:base 和多个 cell。当调用 add() 方法修改这个数的时候,先 CAS 尝试修改 base,如果不成功 (说明有竞争),那就找个 cell 给当前线程,让它修改这个 cell,这个时候线程是独占 cell 的,也就不存在竞争了;而当我们读取这个数的时候,就需要将 base 以及所有的 cell 进行合并,这里明眼一看就知道有数据一致性问题,所以 LongAdder 也是不使用一致性要求非常高的场景。

具体可参考:CAS vs 数据库乐观锁_georgesnoopy 的博客 - CSDN 博客。jdk 中另外的一个例子就是 ConcurrentHashMap,已经抛弃了 jdk7 中分段锁的实现,而是采用了 LongAdder 的这个思路来进一步优化了

基于这个思路,我们来看下惊群效应,之所以一颗石子会惊醒所有的鸟,不就是因为所有的鸟都睡在一起么,所以解决惊群的问题思路就两个:别让鸟都睡在一起;另一个就是叫醒的时候别都叫醒。

第一个思路:别让鸟都睡在一起,对应到锁的实现上,其实就是条件变量。一个锁可以关联多个条件变量,每个条件变量上一个阻塞队列,争抢同一个锁的线程不是都最在一个队列中,而是多个队列中,当一个条件发生时,只是唤醒对应的条件变量队列中的线程。

举个栗子:生产者 - 消费者模型中,会使用锁来防护那个装馒头的篮子,生产者和消费者都会去争抢这个篮子上的锁,但是抢到锁后,如果生产者发现篮子是满的,则继续挂起自己;消费者发现篮子是空的,则继续挂起自己。但是篮子从空变成不空了,会唤醒所有生产者、消费者线程,但这里起目的其实是想唤醒消费者消费的。有了条件变量就可以精准控制了:一个控制篮子为空、一个控制篮子满了,生产者发现篮子满了阻塞在队满条件变量上、消费者发现篮子为空阻塞在篮子空了的条件变量上。当篮子由空变成不空,只是唤醒篮子空了条件变量阻塞队列上的线程;当篮子由满变成不满,只是唤醒篮子满了条件变量阻塞队列上的线程,这样就会大大减少惊群效应。

所以我们可以看到,条件变量其实可以大大减少惊群效应,但是并不能消除。对于睡在同一卧的鸟还是会被同时唤醒。

另外一个思路就是:你特么的别扔石头一下子都叫醒,一个一个去喊不行么?

当然可以,但是到底喊谁呢?java 的实现就是随机,所以会看到条件变量唤醒线程都是有两个方法:notifyAll()-- 相当于扔石头,砸醒所有的鸟;还有一个 notify()-- 相当于随机去叫醒一只鸟。

这么看好像 notify() 更好呀,没有惊群效应了,只是搞醒了一只鸟,很棒。但是你会发现很多地方都不建议去使用 notify(),而是建议使用 notifyAll()。其原因就是防止线程饿死,一个线程可能一直都没有被随机到,那它就一直不会被唤醒。

站在系统调度的角度看,如果说被阻塞的这些线程,优先级不是一样的,有更高的优先级,那这种随机的方式,并不一定就会唤醒高优先级的那个线程,但是唤醒所有,操作系统调度就会考虑线程优先级的。

另外一个问题,为啥没有一个 notify(Thread t),让程序员来指定唤醒那个线程呢?扪心自问,你知道改怎么选么,到底该选哪个?如果再深入说下去,那是不是就得自己来实现一个调度框架了,调度框架来决定该唤醒哪个。

Socket 中的惊群

总结一下,出现惊群效应的场景:多个线程阻塞在相同资源上,当资源 ready 后,唤醒阻塞在该资源上的所有线程,而唤醒的所有线程中,其实只有一个能够成功获得这个资源。

基于此,我们来看 Socket 编程中哪些地方可能出现惊群,首先就是看哪些操作是阻塞的:

  • 初始化 socket。初始化了 socket 的内存结构。不阻塞
  • socket.bind。将 socket 和 ip + 端口绑定,只是修改内存数据,不阻塞。
  • socket.liseten。将主动 socket 变成被动 socket,表示这个 socket 是用来监听客户端连接请求的,并开始监听客户端的链接请求。因为这个只是让服务端 Socket 处于侦听状态,listen() 系统调用本身是不阻塞的。
  • socket.accept。去 listener 完全链接队列中获取连接,当完全链接队列中为空的时候阻塞当前线程。当完成三次握手链接建立后,操作系统内核会将连接放入到完全连接队列中,然后开始唤醒阻塞在完全连接队列上的线程。
  • socket.connect。主动 socket 发起链接请求,背后就是三次握手。是阻塞的。
  • socket.read/write。read 是从读缓冲区读取数据、write 是向写缓冲区写入数据。当读缓冲区空,则 read 阻塞;当写缓冲区满,write 阻塞。ps:当然也有不阻塞的重载。

所以总结起来看,整个 socket 编程中,会阻塞线程的就只有:

  1. 服务端 socket(被动 socket) 的 accept()。当多个线程都对同一个被动 Socket 调用了 accept() 后,如果完全链接队列是空的,那么这些线程都会阻塞到完全链接队列中;当有客户端与服务端完成三次握手,完成了连接建立,则内核会将这个连接放到完全队列中,并唤醒阻塞在这个完全连接队列中的线程。
  2. 客户端 socket(主动 socket) 的 connect()。这个确实会阻塞,但是不支持多线程调用,因为当三次握手完成,连接建立,这个连接就是对应到当前的这个 sokcet 中的。所以对一个已经完成三次握手连接的 socket 再次调用 connect(),会直接报错。因为不会出现多个线程阻塞在同一个队列中,那也就不会出现惊群问题了。
  3. 服务端 / 客户端 socket 完成通信的 read()/write()。对于 read(),实际是去读缓冲区获取数据,当读缓冲区是空的,当前线程就会阻塞在读缓冲区上。那么当多个线程使用相同的 socket 调用 read(),当读缓冲区是空的,则所有线程都会阻塞在这个 socket 的读缓冲区上。当对端发送来数据,网卡收到数据后,会将数据放到读缓冲区中。这个时候操作系统就会唤醒所有阻塞在读缓冲区上的所有进程。出现惊群效应。写也是一样的道理。

所以综上所述,在 Socket 编程中,有三个地方是阻塞的,但只有两个地方会出现多个线程阻塞在相同资源上的问题,所以也就只有两处可能存在惊群问题:serverSocket.accept() 和 socket.read()/socket.write()

linux 新版内核中,在阻塞队列中引入了 WQ_FLAG_EXCLUSIVE 标识,可以用它来解决惊群问题,基本思路是在进入到阻塞队列的时候给线程加上一个 WQ_FLAG_EXCLUSIVE 标识,当阻塞事件解除后,唤醒阻塞队列中的线程时,会依次遍历阻塞队列:遍历时如果阻塞队列中的线程没有 WQ_FLAG_EXCLUSIVE 标识,那就直接唤醒;当遇到第一个带有 WQ_FLAG_EXCLUSIVE 的线程时,同样去唤醒该线程,然后结束遍历。这样就保证了一次就绪事件发生,就只会唤醒一个 WQ_FLAG_EXCLUSIVE 标识的线程。

accept() 的惊群就是这么解决的,因为调用 accept() 而被阻塞的线程,进入阻塞队列的时候,就会被打上 WQ_FLAG_EXCLUSIVE 标识,这样当客户端连接请求到来的时候,就只会有一个因 accept 而阻塞的线程被唤醒,从而避免惊群问题。

从 linux 的 fork 子进程看,父进程中初始化了 listenFd(serverSocket 内封装那个 fd),然后 fork 出了子进程,子进程就将父进程中的 linstenFd 个 copy 过来了,所以多个进程就是公用了一个 listenFd,那这个时候都去调用 accept(listenFd),就存在多个进程都阻塞在 listenFd 上,从而引发惊群效应。

从 java 的角度看:使用线程池去调用同一个 serverSocket.accept(),这样就存在惊群问题,所以同样可以依靠内核的 WQ_FLAG_EXCLUSIVE 标识来解决。

但是从另外一个角度,变换一个线程池设计,其实也就是可以避 accept() 的惊群的:那就是单线程执行 accept(),将 accept() 获得的 clientSocket 交给另外一个线程池去处理。

这种方式的问题就在于 accept() 是单线程的,如果网络并发非常大,以至于单程处理不过来,那么客户端的链接请求完成后,就会在完全队列中挤压,极端情况就是完全对了满了,已经链接上来的客户单通信延迟增大,而再有客户端连接请求,则会失败。

ps:accept() 操作很费时么?如果它仅仅是当三次握手完成后,从完全连接队列中获取链接,然后初始化 ClientSocket,那么这都是纯内存操作,岂不是应该很快才对 (Redis 的单线程很快不是就是因为单线程执行的操作都是纯内存操作么),linux 内核大神求解。 

epoll 中的惊群

同样的,先来看 epoll 的哪些操作是阻塞的,再来分析是否有惊群问题

  1. epoll_create:初始化一个 epoll,即初始化那个红黑树、就绪队列结构。是不阻塞的。
  2. epoll_ctl:增删改查那个红黑树。比如将 ft 注册到 epoll 中、从 epoll 中删除等等。也是不阻塞的。
  3. epoll_wait。这个就是去轮询就绪队列的,看哪些 io 就绪了。这个操作是阻塞的

所以在 epoll 多路复用中,多线程调用 epoll_waite() 的时候,可能会导致惊群问题。具体参考:http://t.csdn.cn/i2mFP

jdk 线程池中的惊群

产生惊群的本质就多个线程阻塞在同一个资源上,当资源 readdy 的时候,会唤醒所有的线程,但唤醒的所有线程中,其实只有一个线程能够获得资源,其他线程又会被阻塞,所以其他线程就是无用的唤醒。

对于线程池就来看线程池中的线程是阻塞在哪里的?档案当然是线程池中的工作队列,而这个工作队列使用的是一个阻塞队列 BlockingQueue。所以问题就转换成线程池使用的阻塞队列,当队非空的时候,如何唤醒阻塞在这个队列上的线程了。

以比较常见的 ArrayBlockingQueu 和 LinkedBlockQueue 为例,会发现,当有元素入队的时候,唤醒线程它使用的是 signal() 方法,而不是 signalAll(),那么就只会随机唤醒一个阻塞在当前队列的中的线程 (notEmpty 是一个条件变量),所以,当使用这两个阻塞队列的时候,jdk 中的线程池是没有惊群问题的。

前面也说过,使用 signal() 方法唤醒的一个最大问题就是饥饿问题、特别是高优先级线程饥饿问题。但是对于线程池来说,其目的只是要求有线程来驱动执行提交过来的任务,但到底哪个线程来执行,是无所谓的,这里 care 的是任务,有优先级也是任务的优先级,而不是线程的优先级。在线程池中的线程是没有任何差别的。

ps:在学习操作系统的时候,肯定都看到过一个说法,线程就是任务、任务就是线程,这两者是可以等价的。这句话既对又不对。对是因为在操作系统中,线程和任务的生命期是一样的,线程执行完任务,线程也就消失了,所以从这个层面来说,这句话是对的。

但是在高级语言中的线程池,其实是将这两个概念分开了,对任务进行实现了更高层面的抽象:

  • 线程:是对 cpu 资源的一个抽象,cpu 调度完全依赖线程这个概念,所以在高级语言中,就特指获取 cpu 的一个载体。
  • 任务:是指一系列的指令。对应到高级编程语言来说,就是一段代码,比如 java 中可以任务 Runnable 接口就是任务,它可以提交给线程池让线程来执行 Runnable#run() 方法的代码。

 所以从这个层面说,线程是去驱动任务来执行的。但一定要注意,如果对应到操作系统中的任务 (exec() 执行的指令序列),线程池中执行的任务还是 Runnable 么?答案是否定的,它实际上执行的是 blockingQueue.take().run()。所以 jdk 是利用了阻塞队列来实现了线程的复用。所以说 jdk 使用 Runnable 对任务实现了进一步高于线程概念的抽象。

浏览 (299)
点赞
收藏
评论