Docling

Docling

PDF 및 다양한 문서를 마크다운·JSON으로 변환하는 IBM의 경량 오픈소스 라이브러리

무료Python LibraryCLIDocker오픈소스
웹사이트 방문하기docling-project.github.io

검증된 사실

GitHub
★ 60,305
최근 변경
2026-06-12 Docling v2.102.1이 출시되어 서비스 모듈의 image_export_mode 기본값 버그가 수정되고, 사전 서명된 아티팩트를 통한 변환 결과 조회 기능이 추가되었습니다. 소스: http

2026-06-20 직접 확인 · 자동 검증 데이터

제품 화면

Docling 제품 화면

2026-06-20 확인

가격 정보

무료시작 가격: 무료

IBM에서 개발한 오픈소스 문서 파싱 도구로, Apache-2.0 라이선스에 따라 누구나 무료로 사용할 수 있습니다. 별도의 유료 구독 모델은 없으며, 로컬 환경이나 자체 서버에 설치하여 PDF, DOCX 등 다양한 문서를 마크다운이나 JSON 형식으로 변환할 수 있습니다.

가격표 확인하기

최근 업데이트와 소식

  • 소식
    Docling, 리눅스 재단 Agentic AI Foundation 기증·Red Hat OpenShift 오퍼레이터 출시

    IBM이 2026년 초 Docling 프로젝트를 리눅스 재단 Agentic AI Foundation에 기증하고 Red Hat과 함께 은행권을 겨냥한 Docling OpenShift 오퍼레이터를 출시했습니다.

    근거: [APPROX_DATE] SiliconANGLE(2026-02-24) 및 IDP-Software 보도에 따르면 IBM이 Docling을 AAIF에 기증하고 Red Hat OpenShift 오퍼레이터를 2026년 초 출시했으며 은행 부문이 주요 타깃입니다(정확 일자 미상, 월 단위).

  • 버전 업데이트
    IBM, 단일 258M VLM 'Granite-Docling-258M' Apache 2.0 공개

    IBM이 2026년 1월 실험판 SmolDocling을 대체하는 프로덕션급 단일 258M 비전언어모델 Granite-Docling-258M을 Apache 2.0으로 공개했다고 발표했습니다.

    근거: [APPROX_DATE] IBM Research 발표에 따르면 2026년 1월 Granite-Docling-258M을 Apache 2.0으로 공개했습니다(정확 일자 미상, 월 단위).

소개AI 요약

IBM Research에서 공개한 오픈소스 라이브러리로, PDF·DOCX·PPTX 등 다양한 문서 형식을 마크다운이나 JSON으로 신속하게 변환합니다. 2026년 5월 기준 최신 버전은 docling 2.95.0이며, MCP 서버 지원(docling-mcp v2.0)과 ONNX Runtime 기반 경량 추론이 추가되었습니다. AAAI 2025에 논문이 게재되며 학술적으로도 인정받았습니다.

활용 워크플로우

입력

로컬 및 클라우드 소스 문서 (PDF, DOCX, PPTX, HTML)스캔된 이미지 파일 (PNG, JPEG, TIFF)웹 URL 및 온라인 문서 저장소복잡한 표와 수식이 포함된 학술 논문 및 기술 명세서

Docling

AI 모델 기반 레이아웃 분할 및 시각적 요소 탐지TableFormer 엔진을 활용한 표 구조 및 셀 논리 복원통합 OCR (EasyOCR/Tesseract) 기반 텍스트 추출문서 계층 구조(제목, 하위 절, 메타데이터) 식별 및 트리 구성

출력

LLM 최적화 Markdown 데이터구조화된 계층형 JSON/JSONLLangChain/LlamaIndex 연동 Document 객체추출된 시각적 요소(그림, 차트) 이미지 파일

RAG 파이프라인 자동화

데이터 엔지니어가 LangChain 통합 기능을 사용하여 파싱된 데이터를 벡터 데이터베이스에 실시간으로 인덱싱

대규모 아카이브 구조화

스타트업 CTO가 CPU 최적화 로컬 모델을 활용하여 보안이 중요한 대량의 내부 문서를 오프라인에서 마이그레이션

사용자 정의 모델 튜닝

데이터 과학자가 특정 도메인 문서에 맞춰 OCR 엔진 스택이나 레이아웃 예측 임계값을 조정

핵심 차별점: IBM의 TableFormer 모델을 통해 복잡하게 병합된 표의 논리적 구조를 로컬 CPU 환경에서도 완벽하게 복원하는 기술적 우위

주요 기능AI 요약

  • PDF·DOCX·PPTX·HTML·이미지 등 다중 포맷 지원
  • TableFormer 기반 초정밀 표 구조 복원
  • LangChain·LlamaIndex 기본 커넥터 제공
  • OCR 엔진 선택 가능(EasyOCR·Tesseract)
  • Pydantic 기반 엄격한 데이터 스키마 보장
  • 완전 로컬 실행(데이터 외부 전송 없음)
  • MCP 서버 지원 — docling-mcp v2.0 하이브리드 아키텍처(90% 용량 절감)
  • ONNX Runtime 기반 경량 추론 옵션

활용 사례AI 요약

  • 로컬 환경에서의 RAG 데이터 파이프라인 구축
  • 대규모 문서 아카이브의 텍스트 구조화 및 색인
  • 민감한 문서의 오프라인 파싱 및 처리
  • LLM 학습용 고품질 텍스트 데이터 추출

사용자 리뷰

리뷰를 불러오는 중...

대안 도구

이 도구 대신 사용할 수 있는 대안