경량화 레시피: Teacher 지식 조린 소형 모델, 근데 성능을 곁들인
LLM모델 경량화Performance Optimization네이버NAVER ENGINEERING DAY
AI 요약
Beta이 글은 네이버 사내 기술 교류 행사인 NAVER ENGINEERING DAY 2024에서 발표된 세션 내용을 공유합니다. 서비스 애플리케이션에서 요구하는 성능을 유지하면서 대규모 언어 모델(LLM)을 소형 모델로 경량화하는 방법에 대한 레시피를 소개합니다.
특히, 성능 저하 없이 LLM을 줄이는 기술에 초점을 맞추고 있으며, 고품질 제목 추천 및 사물 키워드 추출과 같은 구체적인 적용 사례를 다룹니다. LLM 기반 모델링과 모델 경량화에 관심 있는 개발자들에게 유용한 정보를 제공하며, 네이버의 기술 개발 경험과 노하우를 엿볼 수 있는 기회를 제공합니다.
이 글이 궁금하신가요?
원문 블로그에서 전체 내용을 확인해 보세요
원문 읽으러 가기


