올인원(All in One)으로 엔드투엔드 관찰 가능 시스템을 신속하게 구축

이 기사는 Wang Lei가 Huawei 클라우드 커뮤니티에서 공유한 " 올인원, 신속하게 엔드투엔드 관찰 가능 시스템 구축 "입니다.

클라우드 네이티브 기술 적용으로 Observability가 클라우드 서비스의 주인공이 되었습니다. 애플리케이션의 배포 밀도와 변경 빈도가 기존 환경에 비해 급격하게 변화했습니다. 빠르게 변화하는 호스트의 애플리케이션 동작을 명확하게 발견하고 기록하려면 Observability가 필요합니다. 관찰 가능성은 IT 거버넌스 수준, 비즈니스 온라인화 및 사용자 경험에서 중요한 역할을 하며, 복잡한 시스템 아키텍처가 지속적으로 강화되는 상황에서 비즈니스 연속성 보장 기능을 향상하는 데 도움이 됩니다.

현재의 전통적인 모니터링 시스템은 기업을 위한 다양한 모니터링 도구, 통일된 방식으로 데이터를 관리할 수 없음, R&D 및 테스트 문제 파악 프로세스 중 의사소통의 어려움, 열악한 네트워크, 인터페이스 문제, 재현 불가능 등 많은 한계에 직면해 있습니다. 프런트엔드와 백엔드가 동시에 변경될 때 발생하는 문제, 불완전한 데이터 수집, 데이터 상관관계 분석의 어려움, 데이터의 가치를 빠르게 실현하기 어려운 등의 문제는 모두 기업이 운영 및 유지관리에 있어 해결해야 할 페인포인트입니다. 관찰 가능한 시스템은 복잡한 마이크로서비스 아키텍처에서도 시스템 내부를 이해하는 데 도움이 될 수 있으며, 오류의 원인을 파악하는 것도 더 쉬워집니다.

Huawei Cloud 관측 가능성 분석 파노라마: 통합 액세스, 통합 스토리지 및 통합 관찰

Huawei Cloud는 클라우드 서비스의 특성, 고객 문제점 및 애플리케이션 시나리오를 결합하여 전체 스택 관찰 기능을 구축합니다.지표, 로그 및 콜 체인의 수집을 통해 리소스에서 미들웨어, 애플리케이션에 이르기까지 모든 것을 통합된 관찰이 가능합니다. 기업은 엔드투엔드 터미널 모니터링 쿼리 및 경보를 수행하는 동시에 통합 액세스 및 통합 스토리지를 위한 통합 아키텍처를 구축할 수 있습니다. 사용자가 사용 및 유지 관리가 쉽습니다.

1.PNG

일반적인 비즈니스 아키텍처 및 Observability 시스템 구축

다양한 고객 애플리케이션 배포 구조와 관찰 개체에는 큰 차이가 있습니다. 관찰 개체에는 최종 애플리케이션, 액세스 계층 구성 요소, 애플리케이션, 미들웨어 및 데이터가 포함될 수 있습니다. 이러한 개체는 터미널 장치, 브라우저, IDC 및 클라우드에 배포될 수 있습니다. Huawei Cloud는 다양한 배포 형태에 대한 관찰 가능성 구축을 위한 풀 스택 솔루션을 제공하여 로그, 표시기 및 호출 체인 수준에서 완전하고 빠르며 정확한 가시성이라는 목표를 달성합니다.

Huawei Cloud Observability Platform에는 AOM(애플리케이션 운영 관리), LTS(클라우드 로그 서비스), APM(애플리케이션 성능 관리 서비스), CES(클라우드 모니터링 서비스)의 네 가지 주요 서비스가 포함되어 있으며 인터넷, 정부 및 기업에서 널리 사용됩니다. 효율적인 의사 결정을 추진하고, 클라우드 및 엣지 장치를 하향으로 다루고, 비즈니스와 최종 사용자 경험을 상향으로 연결하고, 비즈니스 관점과 비즈니스 시나리오를 기반으로 관찰 가능성을 달성합니다.

파노라마 데이터 액세스: 즉시 사용 가능, 간단한 구성, 빠른 액세스

Huawei Cloud의 테넌트 중심 관찰 가능 솔루션은 고객 비즈니스 시나리오와 결정론적 운영 및 유지 관리 기술 시스템을 결합하여 기업이 안정적이고 신뢰할 수 있는 고품질 서비스를 구축할 수 있도록 지원합니다. 관찰 분석을 기반으로 비즈니스 모니터링, 애플리케이션 모니터링, 중간 계층 모니터링, 및 기본 모니터링 시설 모니터링 및 기타 데이터 통찰력, 통합 액세스, 통합 스토리지 및 통합 관찰은 민첩한 비즈니스 개발을 지원하고 클라우드 네이티브 환경에서 안정적이고 효율적인 비즈니스 운영을 보장하며 신속한 장애 복구, 변경 위험 제어를 달성합니다. 자원 관리 및 탄력성 평가 및 최적화와 같이 관찰 가능한 운영 및 유지 관리 기능 개선

2.PNG

그림: Huawei 클라우드 관찰 시스템

통합된 관찰 가능한 대형 화면으로 시스템 모니터링과 지능형 운영 및 유지 관리 실현

Huawei Cloud는 대형 화면을 관찰 및 모니터링하고 실시간 데이터 쿼리 및 분석을 수행하며 시스템의 과거 상태와 작동을 이해할 수 있으며, 비정상 또는 장애가 발생하면 즉시 조기 경고 및 통지를 발행하여 문제가 발생하지 않도록 합니다. 동시에 기업이 책임을 지도록 도울 수 있습니다. 사람들은 시스템 구성 최적화, 리소스 할당 조정 등을 할 때 정확한 결정을 내립니다.

대형 모니터링 화면은 애플리케이션/클라우드 서비스/컨테이너/Prometheus/LB 로그 등 수십 개의 데이터 소스를 포함하여 지표/성능/로그를 포괄하는 운영 및 유지 관리 데이터를 시각화합니다. 비즈니스 지표 측면에서는 elb 로그/비즈니스 인터페이스 SLA를 기반으로 추출된 비즈니스 지표 데이터를 제공하고, 애플리케이션 지표 측면에서는 애플리케이션/컴포넌트 성능 지표, 컨테이너 프로메테우스 지표, 미들웨어 지표를 결합한 것이며, 리소스 지표 측면에서는 클라우드 서비스 자원 지표를 연관시키고, ECS/VPC 등의 데이터를 연결합니다.

로그 DSL 처리: 원스톱 로그 처리 플랫폼. DSL(Domain Specic Language) 처리는 LTS에서 제공하는 원스톱 로그 처리 플랫폼으로, 도메인 맞춤형 스크립트 언어와 200개 이상의 내장 기능을 기반으로 엔드투엔드 로그 형성, 강화, 분할, 로그 처리 등을 실현할 수 있습니다. LTS 콘솔에서의 분리 민감화, 여과 및 기타 처리 작업.

대규모 로그 검색: 수백억 개의 로그를 몇 초 안에 검색할 수 있으며, 수천억 개의 로그를 반복적으로 검색할 수 있습니다. LTS가 자체 개발한 검색 엔진은 수백억 개의 로그에 대해 몇 초 만에 검색 결과를 반환할 수 있으며, 여러 번 클릭하면 수천억 개의 로그에 대한 정확한 검색 결과를 반환할 수 있습니다.

4.PNG

로그 DSL 처리: 원스톱 로그 처리 플랫폼

Container Insight Cloud 기본 사용자는 짧고, 단순하고, 빠른 것에 더 많은 관심을 가집니다.

컨테이너화된 애플리케이션 운영, 유지 관리 및 개발 과정에서 관찰 가능성을 향상하고 장애를 효과적으로 해결하는 것이 중요합니다. 예상치 못한 문제를 동적으로 효율적으로 찾아 해결합니다. 시스템을 사용할 수 없는 경우 문제의 상태와 원인을 빠르게 파악하고 효과적으로 예방합니다. 오류 발생, 관찰 기능 구축, 5가지 주요 기능을 통해 문제를 신속하게 정의하는 데 도움이 됩니다.

» 건강 진단: 중위험군 및 고위험군에 대한 시기적절한 주의와 치료

» 리소스 인벤토리: 클러스터 개요, 노드 통계, 배포 통계, 작업 통계 및 이벤트를 포함합니다.

» 데이터 분석: 3가지 유형의 데이터 상관 분석, 계층별 드릴다운;

»전체 디스크 모니터링: 개요, 배포 보기, 클러스터 및 기타 기능을 통합하여 기본 사용 요구 사항을 충족합니다.

» 경보: 다양한 경보 시나리오 처리 사양을 충족하는 48개 이상의 모범 사례 경보 규칙.

5.PNG

애플리케이션 성능 관리 엔드투클라우드 전체 링크 추적

End-to-cloud 전체 링크 추적은 관련된 모든 IT 시스템을 포괄하며, 페이지 로딩 성능, API 요청 대기 시간, 서버 호출 체인 및 기타 시나리오를 포함하여 시스템 간 호출 경로 및 사용자 행동 상태를 완벽하게 기록하는 실용적인 솔루션입니다. 풀 링크 토폴로지 검색을 기반으로 단말 측에서 사용자 경험 모니터링이 수행되고, 액세스 계층에서 서버 측 성능 분석이 수행되며, 데이터베이스에서 데이터 호출이 이루어지므로 보다 민첩하고 신뢰할 수 있는 의사 결정이 가능해집니다.

엔드 투 클라우드 풀 링크는 엔드 사이드 모니터링을 충족하고 특별한 성능 분석을 달성할 수 있을 뿐만 아니라 엔드 투 엔드 문제 진단, 시스템 간 종속성 정렬, 사용자 정의 태그 투명 전송과 같은 핵심 가치를 가져올 수 있습니다. 시스템 대응 상황 분석 및 진단을 통해 비즈니스 프로세스를 최적화하고, 가치의 가시성과 최적화 가능성을 향상시키며, 시스템의 보다 편리한 관리 및 최적화를 달성합니다.

요약하다

Observability는 클라우드 네이티브 시대의 IT와 비즈니스를 연결하는 능력으로, 클라우드 네이티브의 개발로 효율적이고 유연하며 확장 가능한 End-to-End Observability 시스템은 애플리케이션 운영 및 유지 관리, 로그 분석, 및 유지 관리 규정 준수, 운영 분석, 성능 진단 및 기타 응용 시나리오를 통해 IT 시스템의 지속적인 최적화 및 비즈니스 가치 향상을 달성하고 비즈니스 안정성 시스템 역량 구축을 개선하며 IT 거버넌스 수준 및 개발 역량을 향상하고 기업 운영 및 비즈니스에 대한 강력한 보장을 제공합니다. 유지 보수 작업.

화웨이 클라우드의 신기술에 대해 빨리 알아보고 팔로우하려면 클릭하세요~

 

잘 알려진 오픈 소스 프로젝트의 저자는 열광으로 인해 직장을 잃었습니다 - "온라인에서 돈을 구하다" No Star, No Fix 2023 세계 10대 엔지니어링 성과 발표: ChatGPT, Hongmeng 운영 체제, 중국 우주 정거장 및 기타 엄선된 ByteDance OpenAI에서 '금지' Google, 2023년 가장 인기 있는 Chrome 확장 프로그램 발표 Ni Guangnan 학자: 샤오미 휴대폰 BL 잠금 해제를 위해 국산 SSD가 수입 HDD를 대체하길 바라나요 ? 먼저 Java 프로그래머 인터뷰 질문을 해보세요. Arm은 70명 이상의 중국 엔지니어를 해고하고 중국 소프트웨어 사업을 재편할 계획입니다. OpenKylin 2.0 공개 | UKUI 4.10 더블 다이아몬드 디자인, 아름답고 고품질! Manjaro 23.1 출시, 코드명 "Vulcan"
{{o.이름}}
{{이름}}

Guess you like

Origin my.oschina.net/u/4526289/blog/10326312