Disruptor(无锁并发框架)-发布

原文:http://blog.codeaholics.org/2011/the-disruptor-lock-free-publishing/

译者:罗立树

假如你生活在另外一个星球,我们最近开源了一套高性能的基于消息传递的开源框架。

下面我给大家介绍一下如何将消息通过Ring buffer在无锁的情况下进行处理。

在深入介绍之前,可以先快速阅读一下Trish发表的文章,该文章介绍了ring buffer和其工作原理。

这篇文章的要点如下:

1.ring buffer是由一个大数组组成的。

2.所有ring buffer的“指针”(也称为序列或游标)是java long类型的(64位有符号数),指针采用往上计数自增的方式。(不用担心越界,即使每秒1,000,000条消息,也要消耗300,000年才可以用完)。

3.对ring buffer中的指针进行按ring buffer的size取模找出数组的下标来定位入口(类似于HashMap的entry)。为了提高性能,我们通常将ring buffer的size大小设置成实际使用的2倍。

这样我们可以通过位运算(bit-mask )的方式计算出数组的下标。

Ring buffer的基础结构

注意:和代码中的实际实现,我这里描述的内容是进行了简化和抽象的。从概念上讲,我认为更加方面理解。

ring buffer维护两个指针,“next”和“cursor”。

basic-structure1

在上面的图示里,是一个size为7的ring buffer(你应该知道这个手工绘制的图示的原理),从0-2的坐标位置是填充了数据的。

“next”指针指向第一个未填充数据的区块。“cursor”指针指向最后一个填充了数据的区块。在一个空闲的ring bufer中,它们是彼此紧邻的,如上图所示。

填充数据(Claiming a slot,获取区块)

Disruptor API 提供了事务操作的支持。当从ring buffer获取到区块,先是往区块中写入数据,然后再进行提交的操作。

假设有一个线程负责将字母“D”写进ring buffer中。将会从ring buffer中获取一个区块(slot),这个操作是一个基于CAS的“get-and-increment”操作,将“next”指针进行自增。这样,当前线程(我们可以叫做线程D)进行了get-and-increment操作后,

指向了位置4,然后返回3。这样,线程D就获得了位置3的操作权限。

after-d-claim2

接着,另一个线程E做类似以上的操作。

after-e-claim3

提交写入

以上,线程D和线程E都可以同时线程安全的往各自负责的区块(或位置,slots)写入数据。但是,我们可以讨论一下线程E先完成任务的场景…

线程E尝试提交写入数据。在一个繁忙的循环中有若干的CAS提交操作。线程E持有位置4,它将会做一个CAS的waiting操作,直到  “cursor”变成3,然后将“cursor”变成4。

再次强调,这是一个原子性的操作。因此,现在的ring buffer中,“cursor”现在是2,线程E将会进入长期等待并重试操作,直到 “cursor”变成3。

然后,线程D开始提交。线程E用CAS操作将“cursor”设置为3(线程E持有的区块位置)当且仅当“cursor”位置是2.“cursor”当前是2,所以CAS操作成功和提交也成功了。

这时候,“cursor”已经更新成3,然后所有和3相关的数据变成可读。

这是一个关键点。知道ring buffer填充了多少 – 即写了多少数据,那一个序列数写入最高等等,是游标的一些简单的功能。“next”指针是为了保证写入的事务特性。

after-d-commits4

最后的疑惑是线程E的写入可见,线程E一直重试,尝试将“cursor”从3更新成4,经过线程D操作后已经更新成3,那么下一次重试就可以成功了。

after-e-commits5

总结

写入数据可见的先后顺序是由线程所抢占的位置的先后顺序决定的,而不是由它的提交先后决定的。但你可以想象这些线程从网络层中获取消息,这是和消息按照时间到达的先后顺序是没什么不同的,而两个线程竞争获取一个不同循序的位置。

因此,这是一个简单而优雅的算法,写操作是原子的,事务性和无锁,即使有多个写入线程。

原创文章,转载请注明: 转载自并发编程网 – ifeve.com本文链接地址: Disruptor(无锁并发框架)-发布

  • Trackback 关闭
  • 评论 (11)
    • 过路的
    • 2013/03/20 2:06下午

    范德萨

    • 过路的
    • 2013/03/20 2:08下午

    “3.对ring buffer中的指针进行按ring buffer的size取模找出数组的下标来定位入口(类似于HashMap的entry)。为了提高性能,我们通常将ring buffer的size大小设置成实际使用的2倍。

    这样我们可以通过位运算(bit-mask )的方式计算出数组的下标。”

    这个不对吧。。。应该是2的幂次的大小吧。。。。

    • 忆浪
    • 2013/08/31 10:55下午

    如果假设4(E),5(F)都已经写入数据并且提交了,但是3(D)还正在写入数据

    那E,F是不是会一直处于自spins在状态?

    此时如果D提交了数据,有谁来负责更新当然的cursor,是E还是F?

      • linuxlsx
      • 2013/09/17 10:36上午

      这个地方我觉得是 E来负责更新cursor. 因为 E的操作是将 cursor从3设置为4, 而F是从4到5, 所以在E操作之前,F是一直在循环重试的。。。

    • linuxlsx
    • 2013/09/17 10:39上午

    然后,线程D开始提交。线程E用CAS操作将“cursor”设置为3(线程E持有的区块位置)当且仅当“cursor”位置是2.“cursor”当前是2,所以CAS操作成功和提交也成功了。

    这个地方是不是应该是 线程D用CAS操作将 “cursor” 设置为3 (线程D持有的区块位置)。 前文都提到是 线程D持有了位置3, E持有了位置4.

      • 匿名
      • 2013/12/30 11:11上午

      是啊,这里应该是写错了!

      • monkey
      • 2017/06/29 2:41下午

      这里明显写错了,你说的是对的

    • beginThe world
    • 2014/01/22 6:10下午

    得到一个slot,在进行序列号发布的时候,是序列号大小发布的,但是如果在写一个slot时候发生了错误,气候的slot的序列号都不能发布,整个进程不要卡死在这里????

    • beginThe world
    • 2014/01/22 6:12下午

    得到一个slot,在进行序列号发布的时候,是按照序列号大小顺序发布的,但是如果在写一个slot时候发生了错误,其后的slot的序列号都不能发布,整个进程不要卡死在这里????

  1. “,线程D开始提交。线程E用CAS操作将“cursor”设置为3”
    这句话 应该是 : ,线程D开始提交。线程D用CAS操作将“cursor”设置为3 怎么没人反应有这个问题呢?

    • zidanzzg
    • 2017/11/21 8:57上午

    整个disruptor系列文章,就这篇看懂了。。

return top