devmoa

네이버 검색 SRE 1편 - 차세대 검색 모니터링 시스템을 향한 여정

네이버·2023년 1월 20일·00
SRE네이버 검색모니터링 시스템시스템 안정성장애율KubernetesCI/CD

AI 요약

Beta

이 글은 네이버 검색 SRE 팀이 겪었던 경주 지진 장애를 계기로 SRE 방법론을 도입하고, 차세대 검색 모니터링 시스템을 개발하며 검색 서비스의 안정성을 높여온 여정을 다룹니다. 기존 모니터링 시스템의 한계를 극복하고, 새로운 시스템 목표 설정, 설계, 개발 과정에서 발생한 문제점과 해결 과정을 상세히 설명합니다.

이를 통해 검색 서비스의 장애율을 1% 이하로 유지하는 등 가시적인 개선 효과를 거두었음을 보여줍니다. 특히, 지난 몇 년간의 운영 경험을 바탕으로 검색 안정성을 향상시키기 위한 SRE 팀의 지속적인 노력을 강조하며, 앞으로 이어질 KPI 개발기에 대한 기대감을 높입니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다