devmoa

Kubeflow/Katib의 안전한 사용과 커뮤니티를 위해 기여하기

마키나락스·2021년 8월 31일·00
KubeflowKatibMLOpsHyperparameter TuningKubernetesOpen Source Contribution

AI 요약

Beta

마키나락스 Platform 팀은 Kubeflow를 기반으로 MLOps 플랫폼을 개발하며, 특히 Hyperparameter Tuning 및 Neural Architecture Search 기능을 제공하는 Katib 컴포넌트 활용 경험을 공유합니다. Kubeflow는 Kubernetes 기반 ML 워크플로우 플랫폼이지만, 출시 초기라 사용에 불편함이 존재합니다.

이에 팀은 일부 기능을 커스터마이징하고 자체 구현했으며, 보편적으로 적용 가능한 기능은 Pull Request를 통해 오픈소스 프로젝트에 기여했습니다. 본 포스팅은 Katib 사용 중 겪었던 불편 사항과 이를 개선하여 오픈소스에 기여한 경험을 중심으로 다룹니다.

특히, 사내 Kubernetes 클러스터에서 약 10개의 GPU 서버를 활용한 병렬 HPO 수행 배경과 관련 내용을 상세히 설명합니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다