LLM이지만 PDF는 읽고 싶어: 복잡한 PDF를 LLM이 이해하는 방법
LLMPDFPaLADIN문서 처리OCRDoclayout-Yolo
AI 요약
Beta이 글은 LLM이 복잡한 PDF 문서를 이해하고 처리하는 방법을 다루는 NAVER ENGINEERING DAY 2025 발표 내용을 소개합니다. LLM이 PDF를 효과적으로 이해하기 위한 파서인 PaLADIN을 중심으로 설명하며, PaLADIN은 표, 차트, 숫자 등 복잡한 정보를 정확하게 추출하고 표현하는 데 중점을 둡니다.
발표에서는 PaLADIN의 아키텍처 설계, Doclayout-Yolo, nemoretriever-table-structure-v1, google/gemma3-27b-it, Papago OCR 등 다양한 모델 소개와 함께 PDF 파싱 예제, 속도 개선 및 최적화 방안을 제시합니다. 또한, 구축된 파싱 평가셋을 이용한 성능 평가와 AIB 증권사 리포트 요약 서비스 적용 사례를 공유하며, 향후 개선될 부분에 대한 로드맵도 제시합니다.
AI/LLM 활용 및 문서 처리에 관심 있는 개발자들에게 유용한 정보를 제공합니다.
이 글이 궁금하신가요?
원문 블로그에서 전체 내용을 확인해 보세요
원문 읽으러 가기



