devmoa

LLM이지만 PDF는 읽고 싶어: 복잡한 PDF를 LLM이 이해하는 방법

네이버·2025년 12월 4일·00
LLMPDFPaLADIN문서 처리OCRDoclayout-Yolo

AI 요약

Beta

이 글은 LLM이 복잡한 PDF 문서를 이해하고 처리하는 방법을 다루는 NAVER ENGINEERING DAY 2025 발표 내용을 소개합니다. LLM이 PDF를 효과적으로 이해하기 위한 파서인 PaLADIN을 중심으로 설명하며, PaLADIN은 표, 차트, 숫자 등 복잡한 정보를 정확하게 추출하고 표현하는 데 중점을 둡니다.

발표에서는 PaLADIN의 아키텍처 설계, Doclayout-Yolo, nemoretriever-table-structure-v1, google/gemma3-27b-it, Papago OCR 등 다양한 모델 소개와 함께 PDF 파싱 예제, 속도 개선 및 최적화 방안을 제시합니다. 또한, 구축된 파싱 평가셋을 이용한 성능 평가와 AIB 증권사 리포트 요약 서비스 적용 사례를 공유하며, 향후 개선될 부분에 대한 로드맵도 제시합니다.

AI/LLM 활용 및 문서 처리에 관심 있는 개발자들에게 유용한 정보를 제공합니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다