PDF 문서 내의 복잡한 데이터와 구조를 정확히 인식하고 추출하는 AI 기반의 오픈소스 SDK입니다. 다양한 AI 모델과 연동하여 개발자가 문서 분석 및 데이터 활용 애플리케이션을 빠르고 효율적으로 구축할 수 있도록 지원합니다.
OOXML 형태로 구성된 owpml 파일 필터의 모델입니다. 한글 파일 필터 중 하나인 owpml을 OOXML 구조 기반으로 생성하고, 문서를 구성하는 각각의 요소를 추출하고 저장할 수 있습니다.
HWPX 형식의 한글 문서 안에 포함된 메타 태그를 추출하여 콘솔(터미널)에 보여주거나 JSON 파일로 저장할 수 있으며, JSON 파일을 가져온 후 메타 태그를 분류하여 콘솔(터미널)에 보여주거나 JSON 파일로 저장할 수 있습니다.
HWPX 파일의 유효성 검사(Validation Check)를 수행할 수 있습니다.