devmoa

KHP 모니터링과 알림 – 1부

카카오·2022년 12월 19일·00
모니터링알림메트릭로그Apache Druid카카오

AI 요약

Beta

카카오의 KHP 모니터링 및 알림 시스템 구축 경험을 공유하는 글입니다. 100개 이상의 클러스터를 효과적으로 관리하고 장애 발생 시 신속하게 알림을 받을 수 있는 시스템을 오픈소스와 자체 개발 기능을 통합하여 운영하고 있습니다.

이 글은 모니터링 체계 구축 시 개발자들이 겪는 어려움과 해결 과정을 공유하여 현업 개발자들에게 도움을 주는 것을 목표로 합니다. 1부에서는 모니터링의 핵심 데이터인 메트릭과 로그의 수집 및 시각화 방안을 설명하며, 특히 메트릭 데이터의 저장소로 Apache Druid를 선정한 이유와 그 장점을 소개합니다.

2부에서는 수집된 데이터를 활용한 알림 시스템 구축에 대해 다룰 예정입니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다