[DAN 24] 검색과 피드의 만남: LLM으로 완성하는 초개인화 서비스 ③ 사용자 관심 주제 추출
LLM주제 분류HyperCLOVA다중 레이블 분류텍스트 분류개인화
AI 요약
Beta이 글은 사용자 관심 주제 추출을 위한 신규 주제 분류기 개발 과정을 다룹니다. 기존 분류기의 한계점인 스포츠/레저와 같이 포괄적인 카테고리 분류 문제를 해결하기 위해 IAB 분류 체계를 도입하여 640개의 세부 카테고리로 확장했습니다.
또한, TextCNN 모델의 한계를 극복하고 다중 클래스 분류를 효율적으로 처리하기 위해 통합된 단일 LLM(HyperCLOVA)과 빔 서치를 활용했습니다. '나이키 여성 러닝화'를 '패션>신발', '스포츠/레저>걷기/러닝'으로, '세부 스쿠버다이빙'을 '스포츠/레저>워터스포츠>스쿠버다이빙', '여행>해외여행>아시아'와 같이 다중 레이블로 분류하는 것을 목표로 했습니다.
모델 평가에는 HCX-L을 활용하고, 백본 모델로는 서비스 규모에 적합한 HCX-S를 선택했습니다. 이를 통해 초개인화 서비스의 추천 정확도를 높이는 기반을 마련했습니다.
이 글이 궁금하신가요?
원문 블로그에서 전체 내용을 확인해 보세요
원문 읽으러 가기



