devmoa

워드 문서 파일 형식: DOC 포맷의 구조와 이해 (1)

한글과컴퓨터·2026년 2월 9일·00
DOC 포맷OLE2FIBMS-DOC바이너리 형식파일 파싱

AI 요약

Beta

doc) 파일 형식의 내부 구조와 파싱 방법을 단계별로 설명합니다. OLE2 기반 파일 구조를 시작으로, WordDocument, Table, Data Stream의 역할을 분석하고, 문서 해석의 핵심인 FIB(File Information Block)를 통해 데이터 위치와 크기를 추적하는 방법을 다룹니다.

또한 CP 개념과 PLC, STTB, RG 등 주요 데이터 집합 구조를 통해 텍스트와 속성이 어떻게 매핑되는지 설명하며, MS-DOC 공식 명세를 활용해 필요한 데이터명을 찾고 구조를 해석하는 방법을 소개합니다. 마지막으로 Clx 예제를 통해 실제 바이너리 데이터 읽기와 파싱 과정(C++ 코드)을 구체적으로 보여주며, DOC 포맷 내부 구조를 이해하고 문서 데이터를 직접 해석하는 기초를 제시합니다.

문서 데이터를 직접 해석하는 기초를 제시합니다.

이 글이 궁금하신가요?

원문 블로그에서 전체 내용을 확인해 보세요

원문 읽으러 가기

AI 추천 연관 게시글

이 글과 관련된 다른 기술 블로그 글을 AI가 추천합니다