devmoa

서비스의 건강을 수치화 할 수 있을까? — SLI/SLO

무신사·2025년 8월 18일·00
SLISLOSRE서비스 안정성모니터링가용성지연 시간

AI 요약

Beta

본 글은 서비스의 건강 상태를 객관적으로 측정하고 관리하기 위한 SLI(Service Level Indicator)와 SLO(Service Level Objective) 개념을 소개합니다. 기존의 오류율이나 로그만으로는 파악하기 어려운 실제 서비스 문제를 해결하기 위해, Google SRE 문화에서 시작된 SLI/SLO의 중요성을 강조합니다.

SLI는 지연 시간, 가용성, 처리량 등 서비스 품질을 나타내는 지표이며, SLO는 이러한 SLI에 대한 목표치를 설정하는 것입니다. 필자는 29CM Search & Discovery 팀의 경험을 바탕으로 SLI/SLO 도입 및 운영 과정을 공유하며, 이를 통해 서비스의 건강성을 개선하고 고객 경험 손실 및 매출 감소를 방지하는 방안을 제시합니다.

감에 의존하거나 사후 대응하는 방식에서 벗어나 정교하고 객관적인 시스템 진단 방법을 제시하는 것이 핵심입니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다