DevOpsOur Journey to Autoscaling EKS Node Groups for Job Workloads
이 글은 Karrot의 SRE 팀이 EKS 노드 그룹을 작업 워크로드에 맞게 자동 확장하는 과정에서 겪었던 어려움과 해결 과정을 공유합니다. 작업 워크로드는 시작되면 중단하기 어렵고, 중단 시 재시작에 많은 시간과 컴퓨팅 자원이 소모된다는 특징이 있습니다. 이러한 특성 때문에 EKS 노드 그룹의 자동 확장이 까다롭지만, Karrot 팀은 이러한 제약을 극복하고 성공적으로 자동 확장을 구현했습니다. 글에서는 이 과정에서 사용된 기술과 접근 방식에 대한 상세한 내용을 다룹니다.













