ArchitectureService Discovery DR 구성 2부 - Chaos Test로 찾은 예기치 못했던 문제를 고쳐라!
본 글은 11번가에서 MSA 플랫폼 Vine의 Service Discovery 컴포넌트인 Eureka의 Disaster Recovery(DR) 구성 과정에서 발생한 이슈와 해결 과정을 다룹니다. 11번가는 높은 확장성과 운영 편의성을 위해 모놀리식 아키텍처에서 MSA로 전환했으며, Spring Cloud 기반의 Vine 플랫폼을 통해 약 600여 개의 인스턴스와 60여 개의 애플리케이션을 운영 중입니다. 마이크로서비스 간 통신을 위해 인스턴스 주소를 동적으로 관리하는 Service Discovery의 역할이 중요하며, 이를 위해 Eureka를 사용하고 있습니다. IDC와 AWS EKS를 함께 사용하는 하이브리드 클라우드 환경으로 고도화하면서, Eureka 서버를 지역 분산시켜 안정성을 높이는 DR 구성 중 예상치 못한 문제를 Chaos Test를 통해 발견하고 해결한 경험을 공유합니다. 특히, Kubernetes 환경에서의 Eureka DR 구성 시 발생할 수 있는 문제점과 이를 해결하기 위한 방안을 상세히 설명합니다.