경량화 레시피: Teacher 지식 조린 소형 모델, 근데 성능을 곁들인

네이버·2024년 11월 4일·00

LLM모델 경량화Performance Optimization네이버NAVER ENGINEERING DAY

AI 요약

Beta

이 글은 네이버 사내 기술 교류 행사인 NAVER ENGINEERING DAY 2024에서 발표된 세션 내용을 공유합니다. 서비스 애플리케이션에서 요구하는 성능을 유지하면서 대규모 언어 모델(LLM)을 소형 모델로 경량화하는 방법에 대한 레시피를 소개합니다.

특히, 성능 저하 없이 LLM을 줄이는 기술에 초점을 맞추고 있으며, 고품질 제목 추천 및 사물 키워드 추출과 같은 구체적인 적용 사례를 다룹니다. LLM 기반 모델링과 모델 경량화에 관심 있는 개발자들에게 유용한 정보를 제공하며, 네이버의 기술 개발 경험과 노하우를 엿볼 수 있는 기회를 제공합니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

경량화 레시피: Teacher 지식 조린 소형 모델, 근데 성능을 곁들인

AI 요약

AI 추천 연관 게시글

AI 경량화: 더 빠르고 저렴한 AI 서비스

[DAN 24] <DEVIEW> 세션 살펴보기 (참가신청 10/30~31)

대규모 언어모델 너도 나도 업무에 사용해보자: To Beginner

레거시 GPU에 날개 달기: 극한의 서빙 최적화 가이드

HCX-VLM과 함께 홈피드를 더 예쁘게 바꿔보자!