인턴 생활기 시즌2 #2
악성 유저 탐지딥러닝Sparkpyspark시퀀스 데이터임베딩Hive
AI 요약
Beta이 글은 인턴십 기간 동안 경험한 두 가지 주요 프로젝트에 대한 내용을 다룹니다. 첫 번째는 '악성 유저(봇) 탐지' 프로젝트로, 시퀀스 데이터를 활용한 텐서플로우 기반 딥러닝 모델의 성능을 고도화하는 과정입니다.
게임 로그에서 필요한 데이터를 추출하고, pyspark를 사용하여 시퀀스 데이터를 가공하는 방법을 설명합니다. 특히, 각 행동 로그의 시간 간격 계산을 위해 lag 함수와 같은 SQL 함수를 파이썬 스타일로 사용하는 것이 인상 깊었다고 언급합니다.
두 번째는 '모바일 마케팅 데이터 분석' 프로젝트로, Hive 쿼리를 활용하여 사용자 정보를 추출하는 과정을 다룰 예정임을 암시합니다. 전반적으로 데이터 가공 및 분석 역량의 중요성을 강조하며, 실무 경험을 통해 배운 내용을 공유합니다.
이 글이 궁금하신가요?
원문 블로그에서 전체 내용을 확인해 보세요
원문 읽으러 가기



