그리고 차이 FLINK의 불꽃

1 스파크 무국적, 상태 FLINK

우리 세그멘테이션 과정으로 볼 수있는 RDD 처리를 위해 운전자의 RDD으로 볼 수 있도록, 그 자체가 상태이다 스파크.

그러나 FLINK는 이벤트 기반 응용 프로그램이 상태 응용 프로그램의 클래스 차단됩니다 그것은 창에 올 때, 우리는 윈도우의 중합 작업을 기다리고, 처리하는 하나 개의 이벤트 기록으로 받아 비 상태입니다. 윈도우 후 데이터 스트림 사업자 FLINK가 작업 창 전에 넣어 집계해야하므로 작업, 작동 상태 집계 수행 할 수있는 통합 작업 상태 비 . 여기서 중합 전체 스파크가 상태이다 때문일 수있다.

창 2, 개념

창 무한 스트림은 우리가이 버킷에 계산 작업을 수행 할 수 유한 크기 "버킷"배럴로 분할됩니다. 윈도우는 윈도우 데이터 연산자를 수행하지 않은 경우 데이터 조작이 실행됩니다합니다.

3, 워터 마크 개념

각 이벤트는 EVENTTIME와 함께 제공됩니다. 워터 마크는 긴 지연 - 들어오는 모든 데이터 maxEventTime의 현재와 같다. 데이터가 현재 트리거 창이없는 정지 시간 이후에 워터 마크를 수행되면, 해당 윈도우의 실행을 트리거한다.

게시 된 159 개 원래 기사 · 원 찬양 75 · 전망 190 000 +

추천

출처blog.csdn.net/xuehuagongzi000/article/details/103480849