"알리 빅데이터 로드" 연구 노트(1)

먼저 OLAP와 OLTP의 차이점을 확인하십시오.

OLTP (온라인 거래  처리 ): 온라인/온라인 거래 처리. 일반적인 OLTP 작업은 비교적 간단하며 주로 데이터베이스에서 데이터를 추가, 삭제, 수정 및 쿼리하며 작업의 주체는 일반적으로 제품의 사용자 또는 운영자입니다.

OLAP (온라인 분석 처리): 온라인 분석 처리를 말합니다. 데이터베이스의 데이터를 분석하여 결정적인 것을 그립니다. 예를 들어 상사에 대한 보고서, 시장 개발을 위한 사용자 행동 통계, 다양한 차원 의 요약 분석 결과 등. 운영 주체는 일반적으로 운영, 영업, 마케팅 등의 팀원입니다.

단일 OLTP에서 처리되는 데이터의 양은 상대적으로 적고 관련된 테이블은 일반적으로 하나 또는 두 개의 테이블로 매우 제한적입니다. OLAP은 대량의 데이터에서 일정한 규칙성을 찾아내는 것으로 count(), sum(), avg()와 같은 집계 방법은 현재 상황을 이해하고 향후 계획/결정에 대한 데이터 지원을 제공하는 데 자주 사용되므로 여러 테이블의 데이터를 조인하고 요약하는 데 매우 일반적입니다.

OLTP 데이터베이스(데이터베이스)와의 데이터 양과 복잡성의 차이를 표현하기 위해 OLAP의 연산 객체를 일반적으로 데이터 웨어하우스 (Data Warehouse)라고 하며, 이를 데이터 웨어하우스라고 합니다. 데이터베이스 웨어하우스의 데이터는 종종 여러 데이터베이스와 해당 비즈니스 로그에서 가져옵니다.

그림

내 이해는 다음과 같습니다. OPTP는 혼란을 피하기 위해 하나의 트랜잭션 내에서 수행되는 작업의 각 배치를 추가, 삭제, 수정 및 확인하는 것과 같은 트랜잭션 처리의 일관성에 더 많은 관심을 기울입니다. OLAP는 데이터 통합에 더 많은 관심을 기울이고 분석을 위해 서로 다른 소스의 데이터를 통합합니다.

ER 모델 입문 튜토리얼 - bmms.me

Atomic Indicators
Atomic Indicator는 비즈니스 프로세스에 기반한 측정 값을 말함 이름에서 알 수 있듯이 분할할 수 없음
핵심 기능: 지표의 집계 논리 정의
세 가지 요소: 비즈니스 프로세스 측정 값 집계 논리

파생 지표
파생 지표는 원자 지표의 관계를 기반으로 합니다. 파생 지표 = 원자 지표 + 통계 주기 + 비즈니스 + 통계적 세분성
예시 구체적인 설명:
파생 지표: 지난 주 지방의 휴대 전화 카테고리에 대한 총 주문량
Atomic 지표: 총 주문(비즈니스 프로세스 정의, 메트릭 값 집계 논리)
통계 주기: 지난 주(통계 범위를 제한하는 것은 특별한 비즈니스 제한임)
비즈니스 제한: 범주는 휴대 전화입니다(통계 범위 제한, where condition in SQL)
통계적 세분성: 지방(통계적 세분성 정의, SQL의 group by 와 동일)

파생 지표
파생 지표는 다양한 논리 연산을 통해 하나 이상의 파생 지표를 기반으로 형성됩니다.
비율, 비율 등과 같은 지표

 

 

 

 

 

 

 

 

 

 

 

Supongo que te gusta

Origin blog.csdn.net/weixin_51981189/article/details/131030175
Recomendado
Clasificación