Snorkel을 활용해 라벨 보정하기

엔씨소프트_DANBI·2020년 10월 19일·00

SnorkelWeak SupervisionLabel CorrectionFraud Detection머신러닝Data Labeling

AI 요약

Beta

본 글은 게임 서비스의 부정 행위 탐지 시스템 개발 과정에서 발생하는 라벨 신뢰도 문제를 해결하기 위해 Snorkel을 활용한 라벨 보정 도구 적용 사례를 소개합니다. 기존 Fraud Detection 시스템은 도메인 지식 부족, 탐지 규칙의 한계, 가변적인 제재 정책 등으로 인해 라벨 확보 및 활용에 어려움을 겪습니다.

특히 '제재 이력 없음'이라는 라벨은 노이즈 라벨로 작용할 수 있어 보정이 필요합니다. 이에 대한 해결책으로 Weak Supervision 기법을 도입했습니다.

Weak Supervision은 노이즈가 있거나 제한적인 소스(Weak Label)를 활용하여 대규모 학습 데이터를 구축하는 머신러닝 분야입니다. 본문에서는 직접적인 라벨로 사용하기 어려운 태깅 정보들을 Weak Label로 간주하고, Snorkel이라는 도구를 통해 이를 취합하여 학습에 유용한 라벨로 변환하는 과정을 설명합니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

Snorkel을 활용해 라벨 보정하기

AI 요약

AI 추천 연관 게시글

배민 리뷰 품질을 향상시킨 방법은? 머신 러닝 X 네트워크 탐지 모델 도입

배송 완료 사진 속 객체 탐지를 통한 수기 검수 비용 줄이기

보안 모니터링을 위한 머신러닝 알고리즘 적용기

코딩 에이전트를 활용한 취약점 수집·생성 자동화로 가드레일 모델 고도화

이미지 라벨링(Image Labeling), 노가다가 답일까?