devmoa

Redshift DW에서 PG DM을 만드는 여정

매드업·2022년 4월 1일·00
RedshiftPostgreSQLData WarehouseData MartAthenaSQL

AI 요약

Beta

이 글은 AWS S3에 저장된 원시 데이터를 Athena로 쿼리하는 방식의 비효율성을 해결하기 위해 Redshift 기반의 데이터 웨어하우스(DW)를 구축하고, 이를 활용하여 PostgreSQL 기반의 데이터 마트(DM)를 만드는 과정을 다룹니다. 기존 S3+Athena 조합은 비용과 속도 측면에서 불리했으며, 특히 람다를 통한 쿼리 수행 시 발생하는 비용 문제가 컸습니다.

Redshift를 도입하여 데이터 웨어하우스를 구축한 후, PostgreSQL 데이터 마트를 만들기 위한 여정을 시작합니다. 초기 Redshift 사용 시 Hash Join으로 인한 CPU 사용량 증가 및 세션 끊김 현상이 발생했지만, Hash Join의 원리를 이해하고 최적화 방안을 모색하며 효율적인 데이터 처리 시스템을 구축해 나가는 과정을 설명합니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다