devmoa

글로벌 서비스에서 지역 통신사 네트워크 이슈 트러블슈팅하기

하이퍼커넥트·2024년 6월 24일·00
SRE네트워크 이슈트러블슈팅모니터링데이터 분석글로벌 서비스

AI 요약

Beta

글로벌 서비스 Azar에서 발생하는 지역 통신사 네트워크 이슈 트러블슈팅 경험을 공유합니다. SRE 팀은 특정 국가의 소수 사용자에게만 발생하는 네트워크 문제를 해결하기 위해 데이터 분석에 집중했습니다.

초기에는 컴포넌트 A 관련 오류와 클라이언트 측 에러 발생이 관찰되었으나, 특정 통신사를 이용하는 사용자들에게서 문제가 집중되는 패턴을 발견했습니다. 기존 모니터링 도구로는 파악하기 어려웠던 이 문제를 해결하기 위해 사용자 그룹의 공통점을 찾고 장기적으로 증가하는 에러 추이에 주목했습니다.

Databricks와 사내 플랫폼을 활용하여 클라이언트 에러 로그를 분석하며 문제의 근본 원인을 좁혀나가는 과정을 설명합니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다