한눈에 파악하는 데이터 (탐색적 데이터 분석)
EDA탐색적 데이터 분석데이터 분석데이터 시각화수치형 데이터범주형 데이터
AI 요약
Beta본 글은 지마켓의 한한주 개발자가 작성한 탐색적 데이터 분석(EDA)에 대한 소개 글입니다. EDA는 정제되지 않은 대용량 데이터를 다룰 때 데이터의 형태를 정의하고 시각화를 통해 친근하게 분석을 시작할 수 있도록 돕는 방법론입니다.
위키백과에 따르면 EDA는 기존 통계학의 가설 검정 중심 접근 방식을 보완하여, 주어진 자료만으로도 충분한 정보를 찾도록 개발되었습니다. 글에서는 데이터 종류를 수치형과 범주형으로 나누어 설명하며, 특히 수치형 데이터의 다섯 가지 요약(최솟값, 제1사분위수, 중앙값, 제3사분위수, 최댓값)과 이를 파이썬의 describe() 함수 및 박스 플롯으로 시각화하는 방법을 예시와 함께 제시합니다.
이를 통해 데이터에 대한 이해를 높이고 더 정교한 모델 개발의 기초를 다질 수 있습니다.
이 글이 궁금하신가요?
원문 블로그에서 전체 내용을 확인해 보세요
원문 읽으러 가기


