HPC를 여행하는 히치하이커를 위한 안내서 Part 2.
HPCSlurm스케줄러Kubernetes컨테이너자원 관리
AI 요약
Beta본 글은 HPC(고성능 컴퓨팅) 환경에서 핵심적인 역할을 하는 스케줄러, Slurm의 내부 구조와 작동 방식을 심층적으로 다룹니다. 지난 글에서 HPC의 기본 개념을 소개했다면, 이번 글에서는 Slurm의 아키텍처, 핵심 데몬(slurmctld, slurmd, slurmdbd)의 역할, 그리고 Job의 전체 라이프사이클을 상세히 설명합니다.
또한, 실제 사용자가 Job을 제출하고 관리하는 과정, Worker 노드에서의 작업 실행, 그리고 QOS, Fairshare, Preemption과 같은 자원 관리 정책에 대한 실전 예제와 활용법을 제공합니다. 이를 통해 Slurm의 복잡한 내부 동작을 이해하고 효율적으로 HPC 자원을 관리하는 방법을 안내합니다.
이 글이 궁금하신가요?
원문 블로그에서 전체 내용을 확인해 보세요
원문 읽으러 가기


