devmoa

[DAN 24] 검색과 피드의 만남: LLM으로 완성하는 초개인화 서비스 ③ 사용자 관심 주제 추출

네이버·2025년 1월 2일·00
LLM주제 분류HyperCLOVA다중 레이블 분류텍스트 분류개인화

AI 요약

Beta

이 글은 사용자 관심 주제 추출을 위한 신규 주제 분류기 개발 과정을 다룹니다. 기존 분류기의 한계점인 스포츠/레저와 같이 포괄적인 카테고리 분류 문제를 해결하기 위해 IAB 분류 체계를 도입하여 640개의 세부 카테고리로 확장했습니다.

또한, TextCNN 모델의 한계를 극복하고 다중 클래스 분류를 효율적으로 처리하기 위해 통합된 단일 LLM(HyperCLOVA)과 빔 서치를 활용했습니다. '나이키 여성 러닝화'를 '패션>신발', '스포츠/레저>걷기/러닝'으로, '세부 스쿠버다이빙'을 '스포츠/레저>워터스포츠>스쿠버다이빙', '여행>해외여행>아시아'와 같이 다중 레이블로 분류하는 것을 목표로 했습니다.

모델 평가에는 HCX-L을 활용하고, 백본 모델로는 서비스 규모에 적합한 HCX-S를 선택했습니다. 이를 통해 초개인화 서비스의 추천 정확도를 높이는 기반을 마련했습니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다