Spark on Kubernetes로 가자!

뱅크샐러드·2023년 1월 5일·00

SparkKubernetesEMRYARN데이터 파이프라인Data LakeSelf-hosted

AI 요약

Beta

뱅크샐러드 데이터 플랫폼 팀은 기존의 EMR, YARN 기반 Spark 환경을 Self-hosted Kubernetes 기반으로 전환한 경험을 공유합니다. 기존 환경에서는 EMR 클러스터 운영 중 발생하는 다양한 문제점과 세세한 설정의 어려움을 겪었습니다.

이 글은 이러한 문제점을 해결하고 데이터 분석 환경의 컴퓨팅을 Kubernetes로 이전하는 과정에서 얻은 인사이트를 제공합니다. 데이터 레이크 구축, Spark job 실행, 그리고 Kubernetes 환경에서의 효율적인 자원 관리 및 배포 전략에 대한 내용을 다룹니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다

SparkKubernetesEMR
Spark on Kubernetes로 이관하기
우아한형제들·2023년 1월 31일
SparkKubernetesData Pipeline
LINE 서비스의 대규모 광고 데이터를 처리하기 위한 Spark on Kubernetes 적용기
라인·2026년 3월 31일
Amazon EKSSparkKubernetes
Amazon EKS 환경에서 다양한Spark 애플리케이션 제출 방법 비교하기
AWS·2023년 9월 11일
SlurmKubernetesAmazon EKS
Amazon EKS에서 Slinky를 사용하여 Slurm 배포하기
AWS·2026년 1월 23일
Amazon EKSSparkKubernetes
Amazon EKS 환경에서 다양한Spark 애플리케이션 제출 방법 비교하기
AWS·2023년 9월 11일

Spark on Kubernetes로 이관하기

LINE 서비스의 대규모 광고 데이터를 처리하기 위한 Spark on Kubernetes 적용기

Amazon EKS 환경에서 다양한Spark 애플리케이션 제출 방법 비교하기

Amazon EKS에서 Slinky를 사용하여 Slurm 배포하기

Amazon EKS 환경에서 다양한Spark 애플리케이션 제출 방법 비교하기