LINE 서비스의 대규모 광고 데이터를 처리하기 위한 Spark on Kubernetes 적용기

라인·2026년 3월 31일·00

SparkKubernetesData PipelineBig DataHadoopLINE Ads

AI 요약

Beta

LINE 광고 플랫폼은 하루 수십억 건 이상의 광고를 송출하고 천억 건에 준하는 데이터를 수집 및 가공합니다. 데이터 파이프라인 팀은 광고 효율 증대를 위해 실시간 데이터 처리, 가공, 저장, 전송 역할을 수행하며, 피처 증가로 인한 연산량 증가와 기존 Hadoop 기반 YARN 환경의 한계(자원 경합, 높은 운영 비용, 앱 의존성)를 겪고 있었습니다.

이러한 문제를 해결하기 위해 LINE은 인프라 독립성과 유연한 컨테이너 환경을 제공하는 Spark on Kubernetes를 도입했습니다. 이 글은 Spark on Kubernetes 도입 과정과 그 성과를 공유하며, 대규모 광고 데이터 처리를 위한 안정적이고 확장 가능한 데이터 파이프라인 구축의 중요성을 강조합니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

LINE 서비스의 대규모 광고 데이터를 처리하기 위한 Spark on Kubernetes 적용기

AI 요약

AI 추천 연관 게시글

Spark on Kubernetes로 가자!

Kafka와 MongoDB, Kubernetes로 유연하고 확장 가능한 LINE 쇼핑 플랫폼 구축하기

대규모 Kubernetes 클러스터 구축기

Spark, Mesos, Zeppelin, HDFS를 활용한 대용량 보안 데이터 분석

쿠버네티스 네이티브 워크플로를 이용한 대용량 스트리밍 파이프라인 검증 자동화 - 1편