카카오 AI 가드레일 모델, Kanana Safeguard 시리즈를 소개합니다.
AI 가드레일Kanana Safeguard생성형 AI프롬프트 공격모델 안전성한국어 특화
AI 요약
Beta생성형 AI 시대에 AI 응답의 안전성과 신뢰성을 확보하기 위한 핵심 기술인 AI 가드레일에 대한 카카오의 접근 방식을 소개합니다. 카카오는 한국어 사용자 환경에 특화된 AI 가드레일 모델 개발의 필요성을 느끼고, 'Kanana Safeguard' 시리즈를 선보였습니다.
이 시리즈는 '성적 콘텐츠' 탐지와 '프롬프트 해킹' 탐지처럼 리스크별로 성격과 필요한 정보 범위가 다른 문제들을 효과적으로 해결하기 위해 세분화된 3가지 모델(Kanana Safeguard, Kanana Safeguard-Siren, Kanana Safeguard-Prompt)로 구성됩니다. 이를 통해 카카오는 보다 정교하고 분화된 리스크 분류 체계와 판단 모델을 구축하여 신뢰할 수 있는 AI 생태계 조성에 기여하고자 합니다.
이 글이 궁금하신가요?
원문 블로그에서 전체 내용을 확인해 보세요
원문 읽으러 가기