怎么理解Condition

版权声明:本文为本作者原创文章,转载请注明出处。感谢码梦为生| 刘锟洋 的投稿。

在java.util.concurrent包中,有两个很特殊的工具类,Condition和ReentrantLock,使用过的人都知道,ReentrantLock(重入锁)是jdk的concurrent包提供的一种独占锁的实现。它继承自Dong Lea的 AbstractQueuedSynchronizer(同步器),确切的说是ReentrantLock的一个内部类继承了AbstractQueuedSynchronizer,ReentrantLock只不过是代理了该类的一些方法,可能有人会问为什么要使用内部类在包装一层? 我想是安全的关系,因为AbstractQueuedSynchronizer中有很多方法,还实现了共享锁,Condition(稍候再细说)等功能,如果直接使ReentrantLock继承它,则很容易出现AbstractQueuedSynchronizer中的API被误用的情况。

言归正传,今天,我们讨论下Condition工具类的实现。

ReentrantLock和Condition的使用方式通常是这样的:

C1

运行后,结果如下:

C2

可以看到,

Condition的执行方式,是当在线程1中调用await方法后,线程1将释放锁,并且将自己沉睡,等待唤醒,

线程2获取到锁后,开始做事,完毕后,调用Condition的signal方法,唤醒线程1,线程1恢复执行。

以上说明Condition是一个多线程间协调通信的工具类,使得某个,或者某些线程一起等待某个条件(Condition),只有当该条件具备( signal 或者 signalAll方法被带调用)时 ,这些等待线程才会被唤醒,从而重新争夺锁。

那,它是怎么实现的呢?

首先还是要明白,reentrantLock.newCondition() 返回的是Condition的一个实现,该类在AbstractQueuedSynchronizer中被实现,叫做newCondition()

C3

它可以访问AbstractQueuedSynchronizer中的方法和其余内部类( AbstractQueuedSynchronizer是个抽象类,至于他怎么能访问,这里有个很奇妙的点,后面我专门用demo说明 )

现在,我们一起来看下Condition类的实现,还是从上面的demo入手,

为了方便书写,我将AbstractQueuedSynchronizer缩写为AQS

当await被调用时,代码如下:

[code lang=”java”]
public final void await() throws InterruptedException {
if (Thread.interrupted())
throw new InterruptedException();
Node node = addConditionWaiter(); //将当前线程包装下后,
//添加到Condition自己维护的一个链表中。
int savedState = fullyRelease(node);//释放当前线程占有的锁,从demo中看到,
//调用await前,当前线程是占有锁的

int interruptMode = 0;
while (!isOnSyncQueue(node)) {//释放完毕后,遍历AQS的队列,看当前节点是否在队列中,
//不在 说明它还没有竞争锁的资格,所以继续将自己沉睡。
//直到它被加入到队列中,聪明的你可能猜到了,
//没有错,在singal的时候加入不就可以了?
LockSupport.park(this);
if ((interruptMode = checkInterruptWhileWaiting(node)) != 0)
break;
}
//被唤醒后,重新开始正式竞争锁,同样,如果竞争不到还是会将自己沉睡,等待唤醒重新开始竞争。
if (acquireQueued(node, savedState) && interruptMode != THROW_IE)
interruptMode = REINTERRUPT;
if (node.nextWaiter != null)
unlinkCancelledWaiters();
if (interruptMode != 0)
reportInterruptAfterWait(interruptMode);
}

[/code]

回到上面的demo,锁被释放后,线程1开始沉睡,这个时候线程因为线程1沉睡时,会唤醒AQS队列中的头结点,所所以线程2会开始竞争锁,并获取到,等待3秒后,线程2会调用signal方法,“发出”signal信号,signal方法如下:

[code lang=”java”]

public final void signal() {
if (!isHeldExclusively())
throw new IllegalMonitorStateException();
Node first = firstWaiter; //firstWaiter为condition自己维护的一个链表的头结点,
//取出第一个节点后开始唤醒操作
if (first != null)
doSignal(first);
}
[/code]

说明下,其实Condition内部维护了等待队列的头结点和尾节点,该队列的作用是存放等待signal信号的线程,该线程被封装为Node节点后存放于此。

C4

关键的就在于此,我们知道AQS自己维护的队列是当前等待资源的队列,AQS会在资源被释放后,依次唤醒队列中从前到后的所有节点,使他们对应的线程恢复执行。直到队列为空。

而Condition自己也维护了一个队列,该队列的作用是维护一个等待signal信号的队列,两个队列的作用是不同,事实上,每个线程也仅仅会同时存在以上两个队列中的一个,流程是这样的:

1. 线程1调用reentrantLock.lock时,线程被加入到AQS的等待队列中。

2. 线程1调用await方法被调用时,该线程从AQS中移除,对应操作是锁的释放。

3. 接着马上被加入到Condition的等待队列中,以为着该线程需要signal信号。

4. 线程2,因为线程1释放锁的关系,被唤醒,并判断可以获取锁,于是线程2获取锁,并被加入到AQS的等待队列中。

5.  线程2调用signal方法,这个时候Condition的等待队列中只有线程1一个节点,于是它被取出来,并被加入到AQS的等待队列中。  注意,这个时候,线程1 并没有被唤醒

6. signal方法执行完毕,线程2调用reentrantLock.unLock()方法,释放锁。这个时候因为AQS中只有线程1,于是,AQS释放锁后按从头到尾的顺序唤醒线程时,线程1被唤醒,于是线程1回复执行。

7. 直到释放所整个过程执行完毕。

可以看到,整个协作过程是靠结点在AQS的等待队列和Condition的等待队列中来回移动实现的,Condition作为一个条件类,很好的自己维护了一个等待信号的队列,并在适时的时候将结点加入到AQS的等待队列中来实现的唤醒操作。

看到这里,signal方法的代码应该不难理解了。

取出头结点,然后doSignal

C5

[code lang=”java”]
private void doSignal(Node first) {
do {
if ( (firstWaiter = first.nextWaiter) == null) //修改头结点,完成旧头结点的移出工作
lastWaiter = null;
first.nextWaiter = null;
} while (!transferForSignal(first) &&//将老的头结点,加入到AQS的等待队列中
(first = firstWaiter) != null);
}

final boolean transferForSignal(Node node) {
/*
* If cannot change waitStatus, the node has been cancelled.
*/
if (!compareAndSetWaitStatus(node, Node.CONDITION, 0))
return false;

/*
* Splice onto queue and try to set waitStatus of predecessor to
* indicate that thread is (probably) waiting. If cancelled or
* attempt to set waitStatus fails, wake up to resync (in which
* case the waitStatus can be transiently and harmlessly wrong).
*/
Node p = enq(node);
int ws = p.waitStatus;
//如果该结点的状态为cancel 或者修改waitStatus失败,则直接唤醒。
if (ws > 0 || !compareAndSetWaitStatus(p, ws, Node.SIGNAL))
LockSupport.unpark(node.thread);
return true;
}
[/code]

可以看到,正常情况 ws > 0 || !compareAndSetWaitStatus(p, ws, Node.SIGNAL) 这个判断是不会为true的,所以,不会在这个时候唤醒该线程。

只有到发送signal信号的线程调用reentrantLock.unlock()后因为它已经被加到AQS的等待队列中,所以才会被唤醒。

总结:

     本文从代码的角度说明了Condition的实现方式,其中,涉及到了AQS的很多操作,比如AQS的等待队列实现独占锁功能,不过,这不是本文讨论的重点,等有机会再将AQS的实现单独分享出来。

版权声明:本文为本作者原创文章,转载请注明出处。码梦为生| 刘锟洋

原创文章,转载请注明: 转载自并发编程网 – ifeve.com本文链接地址: 怎么理解Condition

  • Trackback 关闭
  • 评论 (19)
    • kx
    • 2014/02/18 10:40下午

    厉害,学习了。以前看jdk1.6的j.u.c包好多都没有看懂。

    • kx
    • 2014/02/18 10:43下午

    kx :
    厉害,学习了。以前看jdk1.6的j.u.c包好多都没有看懂。

    想请教下,楼主是怎么阅读j.u.c源码的,有什么好方法吗?

      • 匿名
      • 2014/02/19 8:54上午

      答案是真没有好的办法 就是仔细分析,一遍遍的看,其实,concurrent包没有想象中的复杂,大部分功能都是围绕AQS来做的,弄明白它,concurrent包中的很多工具类都明白了。

        • Afred
        • 2014/02/19 9:56下午

        AQS是嘛东西?

      • AbstractQueuedSynchronizer

    • tcray
    • 2014/03/06 5:00下午

    你好:
    在“每个线程也仅仅会同时存在以上两个队列中的一个,流程是这样的”中,当前线程加入到AQS的等待队列中,是如你第一步说的调用lock后就放入。还是如你第四步所说,“于是线程2获取锁,并被加入到AQS的等待队列中”。因为调用lock方法不一定获取到锁吧。看着有点迷惑,请指教。

    • 你好:
      是这样的,首先要明白调用lock方法的流程是:调用时马上尝试获取锁,如获取不到,则加入到AQS的等待队列中去,获取不到锁的线程都在AQS的队列中依调用顺序存放。

      而“每个线程也仅仅会同时存在以上两个队列中的一个” 指的是Condition的等待队列和AQS的等待队列,其中,Conditon的等待队列中存放的是调用了await方法的线程,AQS存放的是调用了lock方法的线程,但是要注意,以下流程:
      “而Condition自己也维护了一个队列,该队列的作用是维护一个等待signal信号的队列,两个队列的作用是不同,事实上,每个线程也仅仅会同时存在以上两个队列中的一个,流程是这样的:

      1. 线程1调用reentrantLock.lock时,线程被加入到AQS的等待队列中。

      2. 线程1调用await方法被调用时,该线程从AQS中移除,对应操作是锁的释放。

      3. 接着马上被加入到Condition的等待队列中,以为着该线程需要signal信号。

      4. 线程2,因为线程1释放锁的关系,被唤醒,并判断可以获取锁,于是线程2获取锁,并被加入到AQS的等待队列中。

      5. 线程2调用signal方法,这个时候Condition的等待队列中只有线程1一个节点,于是它被取出来,并被加入到AQS的等待队列中。 注意,这个时候,线程1 并没有被唤醒。

      6. signal方法执行完毕,线程2调用reentrantLock.unLock()方法,释放锁”

      说得直白点,线程1,和线程2都是在 不过是在 以上两个等待队列中来回切换,每个队列表示的意义不同。

        • lih
        • 2014/09/12 5:51下午

        “线程1调用reentrantLock.lock时,线程被加入到AQS的等待队列中。” 该线程是哪个线程,线程1 获得了锁怎么会被加入AQS等待队列,你解释的和叙述的真混乱

      • 不好意思,是 线程1调用reentrantLock.lock时,线程1被加入到AQS的等待队列中。 可能当时没太注意这些,所以导致阅读起来有点困难,我找时间同意修改下吧。 谢谢建议

    • lih
    • 2014/09/12 5:55下午

    “线程1调用await方法被调用时,该线程从AQS中移除,对应操作是锁的释放”,应该是lock返回之后就从AQS的队列中移除了吧,
    你这样叙述很容易让人理解为await导致线程1从AQS队列移除,还有1中,线程1调用reentrantLock.lock时如果获得锁也不会加入AQS队列,

    • 对的,你的理解是对的,lock成功的线程意味着获取锁成功,是不会加入到AQS队列中的,而比如线程A调用await方法时,线程A自己会被加入到condition自己的队列中,而不是AQS的队列。

    • 徐贻波
    • 2016/05/09 11:55上午

    请教个问题,如果我开10个线程lock,然后await,开一个线程signalAll,会不会存在signalAll先执行了,然后await一直等待,如果存在怎么解决这个问题?

    • 不会存在这个问题,因为await和signalAll都是在获取独占锁的状态下执行的。

        • 徐贻波
        • 2016/05/10 10:16上午

        我明白是先lock获取才能执行await或signal,但是一个线程先lock执行signal这种情况应该也是存在的吧

    • tosswang
    • 2016/08/04 7:56下午

    有点瑕疵,应该把最后的第一点改为“lock成功的线程意味着获取锁成功,是不会加入到AQS队列中的”毕竟上面的回复中已经说到了,另外,最主要的是,我对作者膜拜中!!!!!!太牛了!!!!!!

    • 艳阳天
    • 2016/11/24 3:08下午

    厉害,看完瞬间就明白了不少。谢谢楼主

    • akka_li
    • 2016/12/01 11:36上午

    看了这篇文章,我决定申请个账号!最中意的是,读者的问题会得到作者的解答,就像是在相互交流探讨,非常喜欢这种氛围!

    • akka_li
    • 2016/12/01 12:34下午

    看了评论及作者的回复后,我的理解是,一个线程除了待在AQS队列(状态1),抑或待在condition内部队列(状态2),还有一种情况是不在以上任意队列中(状态3),应该是这3中状态!大体流程是:a.线程1调用lock方法,因锁被占用,所以线程1被放入AQS队列中(状态1); b.锁被释放,AQS队列中的线程1最终获得了锁,并被从AQS队列中移除(状态1变为状态3),lock方法结束; c.线程1中lock方法结束,获得了锁,之后又调用了await方法,await方法内部,线程1被加入到condition内部队列中(状态3变为状态2),并释放锁,【线程1一直停在await方法中的while循环中,检测线程1是否在AQS队列中,await方法没有结束】; d.其他线程调用了singleAll方法,Condition内部队列中的线程1被移除,并加入到AQS队列中(状态2变为状态1),【这时线程1还没唤醒,只是乖乖待在AQS队列中,因为这个“其他线程”还没结束,还没释放锁】;e.“其他线程”调用了singleAll方法后,继续执行任务直至线程结束释放锁,【这时待在AQS队列中的线程1被唤醒尝试获得锁】,最终获取了锁,线程1被从AQS队列中移除(状态1变为状态3)。这是我看了作者文章和评论后,我个人的理解!另外我用【】括起来的部分,是自己有点不确定和矛盾的地方,c步骤中await方法中while循环,一直检测当前线程是否在AQS队列中,如果存在就结束循环,后续操作不理解;而作者文章中的红字标识的地方,和我d步骤中括起来部分,又说即使线程1从Condition队列进入AQS队列中,也是没被唤醒的,这两个地方怎么结合起来理解?!!

return top