devmoa

29CM 데이터 파이프라인 소개

29CM·2023년 1월 12일·00
데이터 파이프라인ETLAirflowBigQueryGCSPostgreSQL

AI 요약

Beta

29CM의 데이터 파이프라인 변천사와 향후 발전 방향을 소개하는 글입니다. 과거 Phase0에서는 ETL 방식의 데이터 수집, 기준 없는 워크플로 관리, 데이터 중복 저장 등의 문제점을 안고 있었습니다.

이를 해결하기 위해 Phase1에서는 Airflow를 중심으로 데이터 파이프라인을 개선하고, GCS와 BigQuery를 활용하여 데이터 레이크와 데이터 웨어하우스를 통합했습니다. Phase2에서는 더욱 효율적이고 안정적인 데이터 파이프라인 구축을 목표로 하고 있습니다.

이 글은 데이터 기반 의사결정을 위한 데이터 파이프라인 구축 및 운영 경험을 공유하며, 데이터 엔지니어링의 중요성을 강조합니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다