Disruptor(无锁并发框架)-发布
原文:http://blog.codeaholics.org/2011/the-disruptor-lock-free-publishing/
译者:罗立树
假如你生活在另外一个星球,我们最近开源了一套高性能的基于消息传递的开源框架。
下面我给大家介绍一下如何将消息通过Ring buffer在无锁的情况下进行处理。
在深入介绍之前,可以先快速阅读一下Trish发表的文章,该文章介绍了ring buffer和其工作原理。
这篇文章的要点如下:
1.ring buffer是由一个大数组组成的。
2.所有ring buffer的“指针”(也称为序列或游标)是java long类型的(64位有符号数),指针采用往上计数自增的方式。(不用担心越界,即使每秒1,000,000条消息,也要消耗300,000年才可以用完)。
3.对ring buffer中的指针进行按ring buffer的size取模找出数组的下标来定位入口(类似于HashMap的entry)。为了提高性能,我们通常将ring buffer的size大小设置成实际使用的2倍。
这样我们可以通过位运算(bit-mask )的方式计算出数组的下标。
Ring buffer的基础结构
注意:和代码中的实际实现,我这里描述的内容是进行了简化和抽象的。从概念上讲,我认为更加方面理解。
ring buffer维护两个指针,“next”和“cursor”。
在上面的图示里,是一个size为7的ring buffer(你应该知道这个手工绘制的图示的原理),从0-2的坐标位置是填充了数据的。
“next”指针指向第一个未填充数据的区块。“cursor”指针指向最后一个填充了数据的区块。在一个空闲的ring bufer中,它们是彼此紧邻的,如上图所示。
填充数据(Claiming a slot,获取区块)
Disruptor API 提供了事务操作的支持。当从ring buffer获取到区块,先是往区块中写入数据,然后再进行提交的操作。
假设有一个线程负责将字母“D”写进ring buffer中。将会从ring buffer中获取一个区块(slot),这个操作是一个基于CAS的“get-and-increment”操作,将“next”指针进行自增。这样,当前线程(我们可以叫做线程D)进行了get-and-increment操作后,
指向了位置4,然后返回3。这样,线程D就获得了位置3的操作权限。
接着,另一个线程E做类似以上的操作。
提交写入
以上,线程D和线程E都可以同时线程安全的往各自负责的区块(或位置,slots)写入数据。但是,我们可以讨论一下线程E先完成任务的场景…
线程E尝试提交写入数据。在一个繁忙的循环中有若干的CAS提交操作。线程E持有位置4,它将会做一个CAS的waiting操作,直到 “cursor”变成3,然后将“cursor”变成4。
再次强调,这是一个原子性的操作。因此,现在的ring buffer中,“cursor”现在是2,线程E将会进入长期等待并重试操作,直到 “cursor”变成3。
然后,线程D开始提交。线程E用CAS操作将“cursor”设置为3(线程E持有的区块位置)当且仅当“cursor”位置是2.“cursor”当前是2,所以CAS操作成功和提交也成功了。
这时候,“cursor”已经更新成3,然后所有和3相关的数据变成可读。
这是一个关键点。知道ring buffer填充了多少 – 即写了多少数据,那一个序列数写入最高等等,是游标的一些简单的功能。“next”指针是为了保证写入的事务特性。
最后的疑惑是线程E的写入可见,线程E一直重试,尝试将“cursor”从3更新成4,经过线程D操作后已经更新成3,那么下一次重试就可以成功了。
总结
写入数据可见的先后顺序是由线程所抢占的位置的先后顺序决定的,而不是由它的提交先后决定的。但你可以想象这些线程从网络层中获取消息,这是和消息按照时间到达的先后顺序是没什么不同的,而两个线程竞争获取一个不同循序的位置。
因此,这是一个简单而优雅的算法,写操作是原子的,事务性和无锁,即使有多个写入线程。
原创文章,转载请注明: 转载自并发编程网 – ifeve.com本文链接地址: Disruptor(无锁并发框架)-发布
范德萨
“3.对ring buffer中的指针进行按ring buffer的size取模找出数组的下标来定位入口(类似于HashMap的entry)。为了提高性能,我们通常将ring buffer的size大小设置成实际使用的2倍。
这样我们可以通过位运算(bit-mask )的方式计算出数组的下标。”
这个不对吧。。。应该是2的幂次的大小吧。。。。
如果假设4(E),5(F)都已经写入数据并且提交了,但是3(D)还正在写入数据
那E,F是不是会一直处于自spins在状态?
此时如果D提交了数据,有谁来负责更新当然的cursor,是E还是F?
这个地方我觉得是 E来负责更新cursor. 因为 E的操作是将 cursor从3设置为4, 而F是从4到5, 所以在E操作之前,F是一直在循环重试的。。。
然后,线程D开始提交。线程E用CAS操作将“cursor”设置为3(线程E持有的区块位置)当且仅当“cursor”位置是2.“cursor”当前是2,所以CAS操作成功和提交也成功了。
这个地方是不是应该是 线程D用CAS操作将 “cursor” 设置为3 (线程D持有的区块位置)。 前文都提到是 线程D持有了位置3, E持有了位置4.
是啊,这里应该是写错了!
这里明显写错了,你说的是对的
得到一个slot,在进行序列号发布的时候,是序列号大小发布的,但是如果在写一个slot时候发生了错误,气候的slot的序列号都不能发布,整个进程不要卡死在这里????
得到一个slot,在进行序列号发布的时候,是按照序列号大小顺序发布的,但是如果在写一个slot时候发生了错误,其后的slot的序列号都不能发布,整个进程不要卡死在这里????
“,线程D开始提交。线程E用CAS操作将“cursor”设置为3”
这句话 应该是 : ,线程D开始提交。线程D用CAS操作将“cursor”设置为3 怎么没人反应有这个问题呢?
整个disruptor系列文章,就这篇看懂了。。