百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程字典 > 正文

Disruptor框架源码阅读-如何不重复消费

toyiye 2024-05-25 20:11 14 浏览 0 评论

RingBuffer 如何保证数据不丢失

由于ringbuffer是一个环形的队列,那么生产者和消费者在遍历这个队列的时候,如何制衡呢?

1、生产快,消费慢,数据丢失?

生产者速度过快,导致一个对象还没消费完,就循环生产了一个新的对象要加入ringbuffer,导致消费不完整,造成数据丢失?

我们注意到,在我们获取生产者下一个位置的时候,是通过ringbuffer的next方法,而这个next方式是调用了sequencer的next方法

这个对象,在我们创建disruptor对象的时候,创建的

所以这个ringbuffer就是disruptor中的sequencer对象,那么在进行获取next的时候,这里是如何获取下一个的呢?是否会对这个生产获取下一个序列进行相应的等待策略,避免产生相应的干扰!!!

这个各位看官还需多看看里面的代码以及封装(特别是封装,真是九转十八弯),多熟悉,我这绕着绕着很容易就绕晕了,刚开始也是云里雾里。

EventProcessor接口概览

EventProcessor顾名思义,就是事件处理器(handle和process都可以翻译为“处理”,但是process侧重于机器的处理,而handle侧重于有人工的处理,所以使用handle表示用户逻辑的处理,使用process表示机器的处理),这个接口有两个实现类,分别是WorkProcessor和BatchEventProcessor,它们对应的逻辑处理消费者分别是EventHandler和WorkHandler。下面是EventProcessor的UML类图及EventHandler和EventProcessor的接口定义。



/**
* Callback interface to be implemented for processing events as they become available in the {@link RingBuffer}
*
* @param <T> event implementation storing the data for sharing during exchange or parallel coordination of an event.
* @see BatchEventProcessor#setExceptionHandler(ExceptionHandler) if you want to handle exceptions propagated out of the handler.
* 处理事件的回调接口
*/
public interface EventHandler<T>
{
 /**
 * Called when a publisher has published an event to the {@link RingBuffer}
 *
 * @param event published to the {@link RingBuffer}
 * @param sequence of the event being processed
 * @param endOfBatch flag to indicate if this is the last event in a batch from the {@link RingBuffer}
 * @throws Exception if the EventHandler would like the exception handled further up the chain.
 */
 void onEvent(T event, long sequence, boolean endOfBatch) throws Exception;
}
/**
* EventProcessors waitFor events to become available for consumption from the {@link RingBuffer}
* <p>
* An EventProcessor will generally be associated with a Thread for execution.
* 事件执行器,等待RingBuffer有可用消费事件。一个事件处理器关联一个执行线程
*/
public interface EventProcessor extends Runnable
{
 /**
 * Get a reference to the {@link Sequence} being used by this {@link EventProcessor}.
 *
 * @return reference to the {@link Sequence} for this {@link EventProcessor}
 */
 Sequence getSequence();
 /**
 * Signal that this EventProcessor should stop when it has finished consuming at the next clean break.
 * It will call {@link SequenceBarrier#alert()} to notify the thread to check status.
 */
 void halt();
 boolean isRunning();
}

EventProcessor接口继承了Runnable接口,主要有两种实现:单线程批量处理BatchEventProcessor和多线程处理WorkProcessor

在使用Disruptor帮助类构建消费者时,使用handleEventsWith方法传入多个EventHandler,内部使用多个BatchEventProcessor关联多个线程执行。这种情况类似JMS中的发布订阅模式,同一事件会被多个消费者并行消费。适用于同一事件触发多种操作。

而使用Disruptor的handleEventsWithWorkerPool传入多个WorkHandler时,内部使用多个WorkProcessor关联多个线程执行。这种情况类似JMS的点对点模式,同一事件会被一组消费者其中之一消费。适用于提升消费者并行处理能力。

消费技术实现

我们先回顾下Disruptor消费者的两个特点:消费者依赖图(即下文所谓的“消费链”)和事件多播。

假设现在有A,B,C,D四个消费者,它们都能组成什么样的形式呢?从众多的排列组合中,我挑了4组比较有代表性的消费链形式。



image.png

  • 第1组中,消费者A消费按成后,B、C、D可同时消费;
  • 第2组中,消费者A、B、C、D顺序消费;
  • 第3组中,消费者A、B顺序消费后,C、D同时消费;
  • 第4组中,消费者A在消费完成后,B和C可以同时消费,但是必须在都消费完成后,D才能消费。

标号为1、3、4的消费链都使用了事件多播,可见事件多播属于消费链的一种组合形式。注意,在上面4种组合中,每个组合的每一水平行,都属于一个消费者组。

这些还只是较为简单的消费链组成,实际中消费链可能会更复杂。

那么在Disruptor内部是怎么实现消费链的呢?

我们可以先思考下。如果想把独立的消费者组成消费链,那么后方的消费者(组)必然要知道在它前方的消费者(组)的处理情况,否则就做不到顺序消费。同时,消费者也要了解生产者的位置,来判断是否有可用事件。之前我们分析生产者代码的时候,已经讲过,生产者为了不覆盖没有消费完全的事件,必须知道最慢消费者的处理情况

做到了这些才会有能力去控制消费者组成消费链。下面让我们具体看Disruptor中的实现。

单生产者,多消费者模式。多消费者对于消息不重复消费。

package liuqiang.complex.multi;
import com.lmax.disruptor.EventFactory;
import com.lmax.disruptor.RingBuffer;
import com.lmax.disruptor.YieldingWaitStrategy;
import com.lmax.disruptor.dsl.Disruptor;
import com.lmax.disruptor.dsl.EventHandlerGroup;
import com.lmax.disruptor.dsl.ProducerType;
import liuqiang.complex.common.*;
import java.util.concurrent.Executors;
public class Main3 {
 //单生产者,多消费者模式。多消费者对于消息不重复消费。例如:1线程消费了消息0,则2线程只能从0后面的消息消费,不能对消息0进行消费。
 public static void main(String[] args) throws Exception {
 EventFactory<Order> factory = new OrderFactory();
 int ringBufferSize = 1024 * 1024;
 Disruptor<Order> disruptor =
 new Disruptor<Order>(factory, ringBufferSize, Executors.defaultThreadFactory(), ProducerType.SINGLE, new YieldingWaitStrategy());
 /*
 * 该方法传入的消费者需要实现WorkHandler接口,方法的内部实现是:先创建WorkPool,然后封装WorkPool为EventHandlerPool返回。
 * 消费者1、2对于消息的消费有时有竞争,保证同一消息只能有一个消费者消费
 */
 disruptor.handleEventsWithWorkerPool(new OrderHandler1("1"), new OrderHandler1("2"));
 disruptor.start();
 RingBuffer<Order> ringBuffer = disruptor.getRingBuffer();
 Producer producer = new Producer(ringBuffer);
 //单生产者,生产3条数据
 for (int l = 0; l < 3; l++) {
 producer.onData(l + "");
 }
 //为了保证消费者线程已经启动,留足足够的时间。具体原因详见另一篇博客:disruptor的shutdown失效问题
 Thread.sleep(1000);
 disruptor.shutdown();
 }
}

调用handleEventsWithWorkerPool形成WorkerPool,并进一步封装成EventHandlerGroup。对于同一条消息,两消费者不重复消费。

可能输出结果如下:

OrderHandler1 1,消费信息:0

OrderHandler1 2,消费信息:1

OrderHandler1 1,消费信息:2

消费者可用序列屏障-SequenceBarrier

我们重点看一下SequenceBarrier,可直译为“序列屏障”。SequenceBarrier的主要作用是协调获取消费者可处理到的最大序号,内部持有着生产者和其依赖的消费者序列。它的接口定义如下。

public interface SequenceBarrier
{
 /**
 * Wait for the given sequence to be available for consumption.<br>
 * 等待指定序列可用
 * @param sequence to wait for
 * @return the sequence up to which is available
 * @throws AlertException if a status change has occurred for the Disruptor
 * @throws InterruptedException if the thread needs awaking on a condition variable.
 * @throws TimeoutException
 *
 */
 long waitFor(long sequence) throws AlertException, InterruptedException, TimeoutException;
 /**
 * Get the current cursor value that can be read.<br>
 * 获取当前可读游标值
 *
 * @return value of the cursor for entries that have been published.
 *
 */
 long getCursor();
 /**
 * The current alert status for the barrier.<br>
 * 当前的alert状态
 *
 * @return true if in alert otherwise false.
 */
 boolean isAlerted();
 /**
 * Alert the {@link EventProcessor}s of a status change and stay in this status until cleared.<br>
 *
 * 通知消费者状态变化。当调用EventProcessor#halt()将调用此方法。
 */
 void alert();
 /**
 * Clear the current alert status.<br>
 * 清楚alert状态
 */
 void clearAlert();
 /**
 * Check if an alert has been raised and throw an {@link AlertException} if it has.
 * 检查是否发生alert,发生将抛出异常
 * @throws AlertException if alert has been raised.
 */
 void checkAlert() throws AlertException;
}
SequenceBarrier实例引用被EventProcessor持有,用于等待并获取可用的消费事件,主要体现在waitFor这个方法。

要实现这个功能,需要3点条件:

  1. 知道生产者的位置。
  2. 因为Disruptor支持消费者链,在不同的消费者组之间,要保证后边的消 费者组只有在前消费者组中的消费者都处理完毕后,才能进行处理。
  3. 暂时没有事件可消费,在等待可用消费时,还需要使用某种等待策略进行等待。

看下SequenceBarrier实现类ProcessingSequenceBarrier的代码是如何实现waitFor方法。

final class ProcessingSequenceBarrier implements SequenceBarrier
{
 private final WaitStrategy waitStrategy; // 等待可用消费时,指定的等待策略
 private final Sequence dependentSequence; // 依赖的上组消费者的序号,如果当前为第一组则为cursorSequence(即生产者发布游标序列),否则使用FixedSequenceGroup封装上组消费者序列
 private volatile boolean alerted = false; // 当触发halt时,将标记alerted为true
 private final Sequence cursorSequence; // AbstractSequencer中的cursor引用,记录当前发布者发布的最新位置
 private final Sequencer sequencer; // MultiProducerSequencer 或 SingleProducerSequencer
 public ProcessingSequenceBarrier(
 final Sequencer sequencer,
 final WaitStrategy waitStrategy,
 final Sequence cursorSequence,
 final Sequence[] dependentSequences)
 {
 this.sequencer = sequencer;
 this.waitStrategy = waitStrategy;
 this.cursorSequence = cursorSequence;
 if (0 == dependentSequences.length) // 依赖的上一组序列长度,第一次是0
 {
 dependentSequence = cursorSequence;
 }
 else // 将上一组序列数组复制成新数组保存,引用不变
 {
 dependentSequence = new FixedSequenceGroup(dependentSequences);
 }
 }
 @Override
 public long waitFor(final long sequence)
 throws AlertException, InterruptedException, TimeoutException
 {
 // 检查是否停止服务
 checkAlert();
 // 获取最大可用序号 sequence为给定序号,一般为当前序号+1,cursorSequence记录生产者最新位置,
 long availableSequence = waitStrategy.waitFor(sequence, cursorSequence, dependentSequence, this);
 if (availableSequence < sequence)
 {
 return availableSequence;
 }
 // 返回已发布最高的序列值,将对每个序号进行校验
 return sequencer.getHighestPublishedSequence(sequence, availableSequence);
 }
 // ... 
}

相关推荐

为何越来越多的编程语言使用JSON(为什么编程)

JSON是JavascriptObjectNotation的缩写,意思是Javascript对象表示法,是一种易于人类阅读和对编程友好的文本数据传递方法,是JavaScript语言规范定义的一个子...

何时在数据库中使用 JSON(数据库用json格式存储)

在本文中,您将了解何时应考虑将JSON数据类型添加到表中以及何时应避免使用它们。每天?分享?最新?软件?开发?,Devops,敏捷?,测试?以及?项目?管理?最新?,最热门?的?文章?,每天?花?...

MySQL 从零开始:05 数据类型(mysql数据类型有哪些,并举例)

前面的讲解中已经接触到了表的创建,表的创建是对字段的声明,比如:上述语句声明了字段的名称、类型、所占空间、默认值和是否可以为空等信息。其中的int、varchar、char和decimal都...

JSON对象花样进阶(json格式对象)

一、引言在现代Web开发中,JSON(JavaScriptObjectNotation)已经成为数据交换的标准格式。无论是从前端向后端发送数据,还是从后端接收数据,JSON都是不可或缺的一部分。...

深入理解 JSON 和 Form-data(json和formdata提交区别)

在讨论现代网络开发与API设计的语境下,理解客户端和服务器间如何有效且可靠地交换数据变得尤为关键。这里,特别值得关注的是两种主流数据格式:...

JSON 语法(json 语法 priority)

JSON语法是JavaScript语法的子集。JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组JS...

JSON语法详解(json的语法规则)

JSON语法规则JSON语法是JavaScript对象表示法语法的子集。数据在名称/值对中数据由逗号分隔大括号保存对象中括号保存数组注意:json的key是字符串,且必须是双引号,不能是单引号...

MySQL JSON数据类型操作(mysql的json)

概述mysql自5.7.8版本开始,就支持了json结构的数据存储和查询,这表明了mysql也在不断的学习和增加nosql数据库的有点。但mysql毕竟是关系型数据库,在处理json这种非结构化的数据...

JSON的数据模式(json数据格式示例)

像XML模式一样,JSON数据格式也有Schema,这是一个基于JSON格式的规范。JSON模式也以JSON格式编写。它用于验证JSON数据。JSON模式示例以下代码显示了基本的JSON模式。{"...

前端学习——JSON格式详解(后端json格式)

JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScriptProgrammingLa...

什么是 JSON:详解 JSON 及其优势(什么叫json)

现在程序员还有谁不知道JSON吗?无论对于前端还是后端,JSON都是一种常见的数据格式。那么JSON到底是什么呢?JSON的定义...

PostgreSQL JSON 类型:处理结构化数据

PostgreSQL提供JSON类型,以存储结构化数据。JSON是一种开放的数据格式,可用于存储各种类型的值。什么是JSON类型?JSON类型表示JSON(JavaScriptO...

JavaScript:JSON、三种包装类(javascript 包)

JOSN:我们希望可以将一个对象在不同的语言中进行传递,以达到通信的目的,最佳方式就是将一个对象转换为字符串的形式JSON(JavaScriptObjectNotation)-JS的对象表示法...

Python数据分析 只要1分钟 教你玩转JSON 全程干货

Json简介:Json,全名JavaScriptObjectNotation,JSON(JavaScriptObjectNotation(记号、标记))是一种轻量级的数据交换格式。它基于J...

比较一下JSON与XML两种数据格式?(json和xml哪个好)

JSON(JavaScriptObjectNotation)和XML(eXtensibleMarkupLanguage)是在日常开发中比较常用的两种数据格式,它们主要的作用就是用来进行数据的传...

取消回复欢迎 发表评论:

请填写验证码