분산 추적(Spring Cloud Sleuth) 및 로깅(Zipkin)

2024. 9. 24. 08:41MSA

2024/09/23

 

 

※  분산 추적(Spring Cloud Sleuth) 및 로깅(Zipkin)에 대해 알아보자.

 

   ▶ 분산 추적

       ●  분산 추적이란?
            ○   분산 추적은 분산 시스템에서 서비스 간의 요청 흐름을 추적하고 모니터링하는 방법이다.
            ○   각 서비스의 호출 관계와 성능을 시각화하여 문제를 진단하고 해결할 수 있도록 돕는다.
            ○   주요 개념: 트레이스(Trace), 스팬(Span), 컨텍스트(Context)

              ✅ 트레이스(Trace) : 트레이스는 하나의 요청이 시작부터 끝까지 각 서비스를 거치는 전체 흐름을 나타낸다.
                  ▪  하나의 트레이스는 여러 개의 스팬으로 구성된다.
                  ▪  분산 시스템에서 클라이언트의 요청이 여러 서비스로 전달될 때, 각 서비스 호출이 트레이스의 일부로 기록된다.
                  ▪  트레이스 ID는 각 스팬에 공통으로 부여되며, 이를 통해 전체 요청 흐름을 추적할 수 있다.

              ✅ 스팬(Span) : 스팬은 분산 추적에서 가장 작은 단위로, 특정 서비스 내에서의 개별 작업 또는 요청을 나타낸다.
                  ▪  각 스팬은 시작 시간과 종료 시간을 기록하여 작업의 지속 시간을 나타낸다.
                  ▪  스팬은 고유한 스팬 ID를 가지며, 이는 트레이스 ID와 함께 특정 작업을 식별하는 데 사용된다.
                  ▪  스팬은 부모-자식 관계를 가질 수 있으며, 이를 통해 호출 계층 구조를 표현한다.
                  ▪  스팬에는 메타데이터(태그, 로그, 이벤트 등)를 추가하여 상세한 정보를 기록할 수 있다.

              ✅ 컨텍스트(Context)
                  ▪  컨텍스트는 요청이 서비스 간에 전달될 때 함께 전파되어, 각 서비스가 요청의 전체 흐름에 대한 정보를 가질 수 있게 한다.
                  ▪  컨텍스트는 트레이스 ID, 스팬 ID, 부모 스팬 ID 등의 정보를 포함하여 각 서비스가 요청의 출처와 경로를 추적할 수 있도록 돕는다.
                  ▪  서비스 호출 간에 컨텍스트를 유지함으로써, 분산 시스템 전체에서 일관된 추적이 가능하다.

       ●  왜 분산 추적이 필요한가?
            ○   마이크로서비스 아키텍처에서는 여러 서비스가 협력하여 하나의 요청을 처리한다.
            ○   서비스 간의 복잡한 호출 관계로 인해 문제 발생 시 원인을 파악하기 어려울 수 있다.
            ○   분산 추적을 통해 각 서비스의 호출 흐름을 명확히 파악하고, 성능 병목이나 오류를 빠르게 진단할 수 있다.

 

 

   ▶ Micrometer

       ●  Micrometer란?
            ○   Micrometer는 Spring 기반 애플리케이션에서 메트릭을 수집하고 모니터링하기 위한 라이브러리다.
            ○   각 서비스의 성능 지표를 수집하고, Prometheus, Grafana 등과 연동하여 시각화할 수 있다.
            ○   분산 추적을 위한 기능도 제공하여 서비스 간의 호출 흐름을 추적할 수 있다.

       ●  주요 특징                       
            ○   다양한 메트릭 수집: 애플리케이션의 다양한 성능 지표를 수집할 수 있다.
            ○   유연한 연동: Prometheus, Grafana 등 다양한 모니터링 도구와 연동할 수 있다.
            ○   추적 기능: 서비스 간의 호출 흐름을 추적하여 성능 병목을 진단할 수 있다.

 

   ▶ Zipkin

       ●  Zipkin이란?
            ○   Zipkin은 트레이스 데이터를 수집하고 시각화하는 분산 추적 시스템이다.
            ○   각 서비스의 트레이스와 스팬 데이터를 저장하고, 이를 통해 호출 흐름을 시각화한다.

       ●  주요 특징             
            ○   데이터 수집 및 저장: 각 서비스에서 전송된 트레이스 데이터를 수집하고 저장한다.
            ○   시각화: 트레이스 데이터를 시각화하여 서비스 간의 호출 관계를 명확히 파악할 수 있다.
            ○   검색 및 필터링: 특정 트레이스나 스팬을 검색하고 필터링하여 문제를 진단할 수 있다.

 

   ▶ Zipkin 서버 설정

       ●  Zipkin 서버 실행             
            ○   Zipkin 서버를 Docker를 사용하여 실행할 수 있다:

docker run -d -p 9411:9411 openzipkin/zipkin

       ●  Zipkin 대시보드 사용             
            ○   Zipkin 대시보드에 접속하여 트레이스 데이터를 시각화한다:
               ▪  URL: http://localhost:9411
               ▪  트레이스 검색 및 분석

 

   ▶ 분산 추적 예제

       ●  서비스 호출 흐름 추적             
            ○   예제 서비스 간의 호출 흐름을 추적하고, Zipkin 대시보드에서 시각화한다.
            ○   각 서비스 호출 시 트레이스와 스팬이 생성되고, Zipkin 서버로 전송된다.

       ●  성능 병목 진단             
            ○   Zipkin 대시보드를 통해 성능 병목이 발생하는 부분을 식별한다.
            ○   각 스팬의 소요 시간과 호출 관계를 분석하여 성능 문제를 진단하고 해결한다.