devmoa

쿠키런: 킹덤 AWS AZ 장애 아웃라인

데브시스터즈·2023년 2월 16일·00
AWSAZ 장애서비스 복구쿠키런: 킹덤CockroachDB장애 대응회고

AI 요약

Beta

이 글은 데브시스터즈의 쿠키런: 킹덤이 2021년 2월 19일 발생한 AWS 도쿄 리전 데이터센터 장애로 인해 겪었던 서비스 복구 과정을 공유합니다. 2022년 NDC 세션에서도 다뤄진 이 사건은, 회식 자리에서 DB 노드 장애 알람이 울렸을 때 데브옵스 엔지니어들이 CockroachDB의 분산 특성 덕분에 초기에는 크게 당황하지 않았던 상황에서 시작됩니다.

글은 AWS와 같은 클라우드 벤더사도 100% SLA를 보장하지 못하는 상황에서, 장애 발생 시 서비스 복구를 위해 어떤 과정을 거쳤는지 상세히 다룹니다. 특히 CockroachDB의 분산 데이터베이스로서의 역할과 장애 대응 전략에 대한 내용을 포함하고 있습니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다