devmoa

Apache Spark란?

씨앤텍시스템즈·2020년 1월 8일·00
Apache Spark빅데이터인메모리병렬 처리오픈소스컴퓨팅 엔진

AI 요약

Beta

이 글은 빅데이터 소프트웨어이자 화두인 Apache Spark에 대해 소개합니다. Apache Spark는 인-메모리 기반 통합 컴퓨팅 엔진으로, 빅데이터 클러스터 환경에서 데이터를 병렬 처리할 수 있는 오픈소스 소프트웨어입니다.

캘리포니아 대학교 버클리 AMPLab에서 개발되어 아파치 소프트웨어 재단에 기부되었으며, 암시적 데이터 병렬성과 장애 허용 기능을 제공합니다. Spark는 코어 프로그래밍 외에도 Spark SQL, Spark Streaming, Spark MLlib 등 다양한 라이브러리를 지원하여 넓은 범위의 활용이 가능합니다.

이는 빅데이터 처리를 위한 강력하고 유연한 솔루션임을 시사합니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다