RPS 설정으로 네트워크 부하를 분산하라
KubernetesRPSHealth CheckLoad BalancingPodPerformance
AI 요약
Beta넷마블 QA실 성능QA팀에서 겪었던 쿠버네티스 파드 비정상 동작 및 재시작 현상에 대한 분석 및 해결 과정을 공유합니다. 높은 TPS(Transactions Per Second) 환경에서 CPU 사용률이 높지 않음에도 불구하고 파드가 계속 중단되고 재시작되는 문제가 발생했습니다.
원인 분석 결과, 네트워크 부하로 인해 쿠버네티스의 HTTP 헬스체크 기능이 정상적으로 컨테이너 상태 값을 받지 못해 파드가 비자발적으로 중단되는 현상임을 확인했습니다. 이 문제를 해결하기 위해 헬스체크 방식을 개선하는 방안을 모색하고, 궁극적으로 RPS 설정으로 네트워크 부하를 효과적으로 분산시키는 방법을 제시합니다.
이 글이 궁금하신가요?
원문 블로그에서 전체 내용을 확인해 보세요
원문 읽으러 가기


